Pular para o conteúdo principal

Ollama (modelos locais)

O Ollama é uma ferramenta de linha de comando para rodar modelos de IA localmente. É a opção mais simples para quem quer modelos locais sem interface gráfica.

O que você precisa

Instalando o Ollama

Baixe o instalador em ollama.ai/download e execute.

Baixando um modelo

No terminal, rode:

# Llama 3.2 (3B) — leve e rápido
ollama pull llama3.2

# Llama 3.1 (8B) — boa qualidade geral
ollama pull llama3.1

# Qwen 2.5 Coder — excelente para código
ollama pull qwen2.5-coder:7b

# Gemma 2 — boa qualidade para o tamanho
ollama pull gemma2:9b

O Ollama inicia o servidor automaticamente ao subir (porta 11434).

Configurando no NeurAI

  1. Certifique-se de que o Bridge está conectado
  2. Vá em Provedores de IA → Ollama → Configurar
  3. No Modo de conexão, selecione Bridge
  4. URL padrão: http://localhost:11434/v1 (não altere)
  5. No campo Modelo, informe o nome do modelo (ex: llama3.2, qwen2.5-coder:7b)
  6. Clique em Salvar e depois em Ativar

Listando modelos instalados

ollama list

Vantagens do Ollama

  • Instalação simples via linha de comando
  • Sem interface gráfica (ideal para servidores)
  • Suporte nativo a múltiplos modelos
  • Inicia automaticamente como serviço no Windows/macOS
Dica

Use ollama run llama3.2 para testar o modelo no terminal antes de conectar ao NeurAI. Isso confirma que o Ollama está funcionando corretamente.