Imagine ter o ChatGPT rodando 100% na sua máquina!
Sem limites, sem custos mensais, sem enviar dados para fora. É isso que o Ollama faz!
O Ollama é uma ferramenta revolucionária que permite rodar modelos de linguagem avançados (como LLaMA, Gemma, Mistral) diretamente em seu computador.
| Característica | ChatGPT/Claude | Ollama Local |
|---|---|---|
| Privacidade | ❌ Dados vão para empresa | ✅ 100% privado |
| Internet | ❌ Sempre necessária | ✅ Funciona offline |
| Custo | ❌ $20-$200/mês | ✅ Gratuito |
| Customização | ❌ Limitada | ✅ Total |
| Limites de uso | ❌ Sim | ✅ Ilimitado |
Ollama é como um "iTunes para modelos de IA". Ele:
Conecta com repositórios e baixa modelos automaticamente
Roda os modelos diretamente em sua máquina
Otimiza automaticamente RAM e processamento
Interface REST para integrar com suas aplicações
Acesse ollama.ai
Baixe o instalador para Windows (.exe)
Execute o instalador como administrador
Siga o assistente de instalação
Abra o PowerShell ou CMD e teste:
ollama --version
Comando único:
curl -fsSL https://ollama.ai/install.sh | sh
Vamos baixar o LLaMA 3.2, um dos melhores modelos open source:
ollama pull llama3.2
⏱️ Tempo: 5-10 minutos (2GB download)
💾 RAM necessária: ~4GB
Rápido, básico. Bom para testes.
Equilíbrio perfeito qualidade/velocidade
Alta qualidade, precisa de 8GB+ RAM
Qualidade profissional, precisa de 64GB+ RAM
ollama run llama3.2
Vai abrir um chat interativo. Digite qualquer pergunta!
💡 Dica: Digite /bye para sair do chat
O Ollama roda um servidor local que você pode usar em suas aplicações:
ollama serve
Roda em http://localhost:11434
curl http://localhost:11434/api/generate -d '{
"model": "llama3.2",
"prompt": "Por que o Python é popular para IA?",
"stream": false
}'
import requests
import json
def perguntar_ollama(pergunta):
url = "http://localhost:11434/api/generate"
data = {
"model": "llama3.2",
"prompt": pergunta,
"stream": False
}
response = requests.post(url, json=data)
return response.json()["response"]
# Teste
resposta = perguntar_ollama("Como fazer café perfeito?")
print(resposta)
ollama pull [modelo]
Ex: ollama pull gemma:7b
ollama list
Mostra todos os modelos instalados
ollama rm [modelo]
Libera espaço em disco
ollama show [modelo]
Detalhes técnicos do modelo
Corrija textos, melhore redação, crie conteúdo
Explique código, corrija bugs, gere exemplos
Ensina qualquer assunto no seu ritmo
Resume, analisa e extrai insights
ollama ps para ver modelos carregadosOLLAMA_NUM_PARALLEL=4 para mais conversas simultâneasOLLAMA_MAX_LOADED_MODELS=2 para controlar RAMSolução: Execute ollama pull [modelo] primeiro para baixar.
Solução: Tente um modelo menor (1b ou 3b) ou adicione mais RAM.
Solução: Use modelo menor ou feche outros programas para liberar RAM.
Solução: Certifique-se que ollama serve está rodando.
Você acabou de instalar algo que grandes empresas gastam milhões para desenvolver:
"Quem controla a IA, controla o futuro. Agora você está no controle."
- Isaque Victor