Ollama (modelos locais)
O Ollama é uma ferramenta de linha de comando para rodar modelos de IA localmente. É a opção mais simples para quem quer modelos locais sem interface gráfica.
O que você precisa
- NeurAI Bridge instalado (instalar →)
- Ollama instalado (ollama.ai)
Instalando o Ollama
- Windows
- Linux
- macOS
Baixe o instalador em ollama.ai/download e execute.
curl -fsSL https://ollama.ai/install.sh | sh
Baixe em ollama.ai/download ou via Homebrew:
brew install ollama
Baixando um modelo
No terminal, rode:
# Llama 3.2 (3B) — leve e rápido
ollama pull llama3.2
# Llama 3.1 (8B) — boa qualidade geral
ollama pull llama3.1
# Qwen 2.5 Coder — excelente para código
ollama pull qwen2.5-coder:7b
# Gemma 2 — boa qualidade para o tamanho
ollama pull gemma2:9b
O Ollama inicia o servidor automaticamente ao subir (porta 11434).
Configurando no NeurAI
- Certifique-se de que o Bridge está conectado
- Vá em Provedores de IA → Ollama → Configurar
- No Modo de conexão, selecione Bridge
- URL padrão:
http://localhost:11434/v1(não altere) - No campo Modelo, informe o nome do modelo (ex:
llama3.2,qwen2.5-coder:7b) - Clique em Salvar e depois em Ativar
Listando modelos instalados
ollama list
Vantagens do Ollama
- Instalação simples via linha de comando
- Sem interface gráfica (ideal para servidores)
- Suporte nativo a múltiplos modelos
- Inicia automaticamente como serviço no Windows/macOS
Dica
Use ollama run llama3.2 para testar o modelo no terminal antes de conectar ao NeurAI. Isso confirma que o Ollama está funcionando corretamente.