LM Studio (modelos locais)

O LM Studio permite rodar modelos de linguagem diretamente na sua máquina — sem custo de API e sem enviar dados para servidores externos.

O que você precisa

NeurAI Bridge instalado na sua máquina (instalar →)
LM Studio instalado (lmstudio.ai)
GPU com pelo menos 4 GB de VRAM (ou CPU para modelos menores)

Passo a passo

1. Instale o LM Studio

Baixe em lmstudio.ai e instale para seu sistema operacional.

2. Baixe um modelo

No LM Studio, vá em Discover e baixe um modelo. Recomendações:

Modelo	VRAM necessária	Qualidade
`Llama 3.2 3B`	4 GB	Boa para tarefas simples
`Llama 3.1 8B`	6-8 GB	Boa qualidade geral
`Qwen 2.5 Coder 7B`	6-8 GB	Excelente para código
`Mistral 7B`	6-8 GB	Boa qualidade geral

3. Inicie o servidor local

No LM Studio:

Vá em Local Server (ícone <->)
Selecione o modelo carregado
Clique em Start Server
O servidor sobe na porta 1234 por padrão

4. Configure no NeurAI

Certifique-se de que o Bridge está conectado
Vá em Provedores de IA → LM Studio → Configurar
No Modo de conexão, selecione Bridge
URL padrão: http://localhost:1234/v1 (não altere)
No campo Modelo, informe o nome exato do modelo carregado no LM Studio
Clique em Salvar e depois em Ativar

Desempenho

O desempenho depende do hardware:

Com GPU dedicada: velocidade comparável a APIs em nuvem
Apenas CPU: mais lento, mas funcional para modelos menores (3B)
Apple Silicon (M1/M2/M3): excelente desempenho com Metal

Dica

Para desenvolvimento, o Qwen 2.5 Coder 7B ou o DeepSeek Coder v2 Lite têm ótimo desempenho em tarefas de código e rodam bem em máquinas com 8 GB de RAM.

O que você precisa​

Passo a passo​

1. Instale o LM Studio​

2. Baixe um modelo​

3. Inicie o servidor local​

4. Configure no NeurAI​

Desempenho​