Pular para o conteúdo principal

LM Studio (modelos locais)

O LM Studio permite rodar modelos de linguagem diretamente na sua máquina — sem custo de API e sem enviar dados para servidores externos.

O que você precisa

  • NeurAI Bridge instalado na sua máquina (instalar →)
  • LM Studio instalado (lmstudio.ai)
  • GPU com pelo menos 4 GB de VRAM (ou CPU para modelos menores)

Passo a passo

1. Instale o LM Studio

Baixe em lmstudio.ai e instale para seu sistema operacional.

2. Baixe um modelo

No LM Studio, vá em Discover e baixe um modelo. Recomendações:

ModeloVRAM necessáriaQualidade
Llama 3.2 3B4 GBBoa para tarefas simples
Llama 3.1 8B6-8 GBBoa qualidade geral
Qwen 2.5 Coder 7B6-8 GBExcelente para código
Mistral 7B6-8 GBBoa qualidade geral

3. Inicie o servidor local

No LM Studio:

  1. Vá em Local Server (ícone <->)
  2. Selecione o modelo carregado
  3. Clique em Start Server
  4. O servidor sobe na porta 1234 por padrão

4. Configure no NeurAI

  1. Certifique-se de que o Bridge está conectado
  2. Vá em Provedores de IA → LM Studio → Configurar
  3. No Modo de conexão, selecione Bridge
  4. URL padrão: http://localhost:1234/v1 (não altere)
  5. No campo Modelo, informe o nome exato do modelo carregado no LM Studio
  6. Clique em Salvar e depois em Ativar

Desempenho

O desempenho depende do hardware:

  • Com GPU dedicada: velocidade comparável a APIs em nuvem
  • Apenas CPU: mais lento, mas funcional para modelos menores (3B)
  • Apple Silicon (M1/M2/M3): excelente desempenho com Metal
Dica

Para desenvolvimento, o Qwen 2.5 Coder 7B ou o DeepSeek Coder v2 Lite têm ótimo desempenho em tarefas de código e rodam bem em máquinas com 8 GB de RAM.