Grande análise de preço de modelos de IA

Todos os modelos, todas as variantes numa tabelinha. Clica nos cabeçalhos pra ordenar e acha o modelo perfeito pro seu orçamento. Custo mensal calculado pra uso moderado (50K entrada + 20K saída Token/dia).

Essa calculadora foi útil?
🖱️ Dá pra ordenar clicando nos cabeçalhos!Tenta clicar em "Preço de entrada" ou "Custo mensal" pra ver quem é mais barato.

📋 Comparação de preço de todos os modelos

Modelo Variante Entrada ($/M) Saída ($/M) Custo mensal
🧪 GLM GLM-4-Flash Grátis Grátis Grátis Grátis
🦙 Llama Auto-hospedado (Self-hosted) Grátis Grátis Grátis Grátis
🔬 DeepSeek V3.2 (cache hit) Grátis $0.028 $0.42 $0.29
☁️ Qwen Qwen3.5-Flash Grátis $0.028 $0.28 $0.21
🫘 Doubao 1.5 Lite Grátis $0.042 $0.083 $0.11
⚡ MiniMax abab6.5 Grátis $0.069 $0.14 $0.19
💎 Gemini 2.5 Flash-Lite Grátis $0.1 $0.4 $0.39
☁️ Qwen Qwen3.5-Plus Grátis $0.11 $0.67 $0.57
🫘 Doubao 1.5 Pro Grátis $0.11 $0.28 $0.33
🦙 Llama Llama 4 Scout (API) Grátis $0.12 $0.35 $0.39
🌙 Kimi K1.5 Grátis $0.14 $0.56 $0.55
⚡ MiniMax Text-01 Grátis $0.14 $1.39 $1.04
🤖 GPT GPT-4o-mini Grátis $0.15 $0.6 $0.58
🦙 Llama Llama 4 Maverick (API) Grátis $0.2 $0.6 $0.66
🔬 DeepSeek V3.2 (cache miss) Grátis $0.28 $0.42 $0.67
🌙 Kimi K2 Grátis $0.28 $0.83 $0.92
💎 Gemini 2.5 Flash Grátis $0.3 $2.5 $1.95
☁️ Qwen Qwen3-Max Grátis $0.35 $1.4 $1.36
🧠 Claude Haiku 4.5 Grátis $1.0 $5.0 $4.50
🤖 GPT o4-mini Grátis $1.1 $4.4 $4.29
💎 Gemini 2.5 Pro Grátis $1.25 $10.0 $7.88
🤖 GPT o3 Grátis $2.0 $8.0 $7.80
🤖 GPT GPT-4o Grátis $2.5 $10.0 $9.75
🧠 Claude Sonnet 4.6 Grátis $3.0 $15.0 $13.50
🧠 Claude Opus 4.6 Grátis $5.0 $25.0 $22.50
🧪 GLM GLM-4-Plus Grátis $6.94 $6.94 $14.57

💡 Custo mensal é calculado como: 50.000 Tokens de entrada + 20.000 Tokens de saída por dia × 30 dias

🔍 Descobertas interessantes

🏆 Modelo pago mais barato

DeepSeek V3.2 (cache hit) custa só $0.028/M de entrada, quase 100 vezes mais barato que GPT-4o! Se seu prompt não muda muito, DeepSeek é praticamente de graça.

🆓 Opção totalmente grátis

GLM-4-Flash e Llama auto-hospedado são completamente grátis. Flash é pra uso leve, Llama é pra equipes com GPU.

💰 Modelo mais caro

Claude Opus 4.6 custa $25/M de saída, o mais caro. Mas a qualidade é top demais, ideal pra requisitos ultra exigentes.

⚖️ Melhor custo-benefício

GPT-4o-mini ($0.15/$0.6) e Doubao 1.5 Lite (¥0.3/¥0.6) são os melhores na categoria "barato mas funciona".