Ollama (modelos locais)

O Ollama é uma ferramenta de linha de comando para rodar modelos de IA localmente. É a opção mais simples para quem quer modelos locais sem interface gráfica.

O que você precisa

NeurAI Bridge instalado (instalar →)
Ollama instalado (ollama.ai)

Instalando o Ollama

Windows
Linux
macOS

Baixe o instalador em ollama.ai/download e execute.

curl -fsSL https://ollama.ai/install.sh | sh

Baixe em ollama.ai/download ou via Homebrew:

brew install ollama

Baixando um modelo

No terminal, rode:

# Llama 3.2 (3B) — leve e rápido
ollama pull llama3.2

# Llama 3.1 (8B) — boa qualidade geral
ollama pull llama3.1

# Qwen 2.5 Coder — excelente para código
ollama pull qwen2.5-coder:7b

# Gemma 2 — boa qualidade para o tamanho
ollama pull gemma2:9b

O Ollama inicia o servidor automaticamente ao subir (porta 11434).

Configurando no NeurAI

Certifique-se de que o Bridge está conectado
Vá em Provedores de IA → Ollama → Configurar
No Modo de conexão, selecione Bridge
URL padrão: http://localhost:11434/v1 (não altere)
No campo Modelo, informe o nome do modelo (ex: llama3.2, qwen2.5-coder:7b)
Clique em Salvar e depois em Ativar

Listando modelos instalados

ollama list

Vantagens do Ollama

Instalação simples via linha de comando
Sem interface gráfica (ideal para servidores)
Suporte nativo a múltiplos modelos
Inicia automaticamente como serviço no Windows/macOS

Dica

Use ollama run llama3.2 para testar o modelo no terminal antes de conectar ao NeurAI. Isso confirma que o Ollama está funcionando corretamente.

O que você precisa​

Instalando o Ollama​

Baixando um modelo​

Configurando no NeurAI​

Listando modelos instalados​

Vantagens do Ollama​