LM Studio (modelos locais)
O LM Studio permite rodar modelos de linguagem diretamente na sua máquina — sem custo de API e sem enviar dados para servidores externos.
O que você precisa
- NeurAI Bridge instalado na sua máquina (instalar →)
- LM Studio instalado (lmstudio.ai)
- GPU com pelo menos 4 GB de VRAM (ou CPU para modelos menores)
Passo a passo
1. Instale o LM Studio
Baixe em lmstudio.ai e instale para seu sistema operacional.
2. Baixe um modelo
No LM Studio, vá em Discover e baixe um modelo. Recomendações:
| Modelo | VRAM necessária | Qualidade |
|---|---|---|
Llama 3.2 3B | 4 GB | Boa para tarefas simples |
Llama 3.1 8B | 6-8 GB | Boa qualidade geral |
Qwen 2.5 Coder 7B | 6-8 GB | Excelente para código |
Mistral 7B | 6-8 GB | Boa qualidade geral |
3. Inicie o servidor local
No LM Studio:
- Vá em Local Server (ícone
<->) - Selecione o modelo carregado
- Clique em Start Server
- O servidor sobe na porta
1234por padrão
4. Configure no NeurAI
- Certifique-se de que o Bridge está conectado
- Vá em Provedores de IA → LM Studio → Configurar
- No Modo de conexão, selecione Bridge
- URL padrão:
http://localhost:1234/v1(não altere) - No campo Modelo, informe o nome exato do modelo carregado no LM Studio
- Clique em Salvar e depois em Ativar
Desempenho
O desempenho depende do hardware:
- Com GPU dedicada: velocidade comparável a APIs em nuvem
- Apenas CPU: mais lento, mas funcional para modelos menores (3B)
- Apple Silicon (M1/M2/M3): excelente desempenho com Metal
Dica
Para desenvolvimento, o Qwen 2.5 Coder 7B ou o DeepSeek Coder v2 Lite têm ótimo desempenho em tarefas de código e rodam bem em máquinas com 8 GB de RAM.