Grande análise de preço de modelos de IA
Todos os modelos, todas as variantes numa tabelinha. Clica nos cabeçalhos pra ordenar e acha o modelo perfeito pro seu orçamento. Custo mensal calculado pra uso moderado (50K entrada + 20K saída Token/dia).
📋 Comparação de preço de todos os modelos
| Modelo | Variante | Entrada ($/M) | Saída ($/M) | Custo mensal |
|---|---|---|---|---|
| 🧪 GLM | GLM-4-Flash Grátis | Grátis | Grátis | Grátis |
| 🦙 Llama | Auto-hospedado (Self-hosted) Grátis | Grátis | Grátis | Grátis |
| 🔬 DeepSeek | V3.2 (cache hit) Grátis | $0.028 | $0.42 | $0.29 |
| ☁️ Qwen | Qwen3.5-Flash Grátis | $0.028 | $0.28 | $0.21 |
| 🫘 Doubao | 1.5 Lite Grátis | $0.042 | $0.083 | $0.11 |
| ⚡ MiniMax | abab6.5 Grátis | $0.069 | $0.14 | $0.19 |
| 💎 Gemini | 2.5 Flash-Lite Grátis | $0.1 | $0.4 | $0.39 |
| ☁️ Qwen | Qwen3.5-Plus Grátis | $0.11 | $0.67 | $0.57 |
| 🫘 Doubao | 1.5 Pro Grátis | $0.11 | $0.28 | $0.33 |
| 🦙 Llama | Llama 4 Scout (API) Grátis | $0.12 | $0.35 | $0.39 |
| 🌙 Kimi | K1.5 Grátis | $0.14 | $0.56 | $0.55 |
| ⚡ MiniMax | Text-01 Grátis | $0.14 | $1.39 | $1.04 |
| 🤖 GPT | GPT-4o-mini Grátis | $0.15 | $0.6 | $0.58 |
| 🦙 Llama | Llama 4 Maverick (API) Grátis | $0.2 | $0.6 | $0.66 |
| 🔬 DeepSeek | V3.2 (cache miss) Grátis | $0.28 | $0.42 | $0.67 |
| 🌙 Kimi | K2 Grátis | $0.28 | $0.83 | $0.92 |
| 💎 Gemini | 2.5 Flash Grátis | $0.3 | $2.5 | $1.95 |
| ☁️ Qwen | Qwen3-Max Grátis | $0.35 | $1.4 | $1.36 |
| 🧠 Claude | Haiku 4.5 Grátis | $1.0 | $5.0 | $4.50 |
| 🤖 GPT | o4-mini Grátis | $1.1 | $4.4 | $4.29 |
| 💎 Gemini | 2.5 Pro Grátis | $1.25 | $10.0 | $7.88 |
| 🤖 GPT | o3 Grátis | $2.0 | $8.0 | $7.80 |
| 🤖 GPT | GPT-4o Grátis | $2.5 | $10.0 | $9.75 |
| 🧠 Claude | Sonnet 4.6 Grátis | $3.0 | $15.0 | $13.50 |
| 🧠 Claude | Opus 4.6 Grátis | $5.0 | $25.0 | $22.50 |
| 🧪 GLM | GLM-4-Plus Grátis | $6.94 | $6.94 | $14.57 |
💡 Custo mensal é calculado como: 50.000 Tokens de entrada + 20.000 Tokens de saída por dia × 30 dias
🔍 Descobertas interessantes
DeepSeek V3.2 (cache hit) custa só $0.028/M de entrada, quase 100 vezes mais barato que GPT-4o! Se seu prompt não muda muito, DeepSeek é praticamente de graça.
GLM-4-Flash e Llama auto-hospedado são completamente grátis. Flash é pra uso leve, Llama é pra equipes com GPU.
Claude Opus 4.6 custa $25/M de saída, o mais caro. Mas a qualidade é top demais, ideal pra requisitos ultra exigentes.
GPT-4o-mini ($0.15/$0.6) e Doubao 1.5 Lite (¥0.3/¥0.6) são os melhores na categoria "barato mas funciona".