Grande análise de preço de modelos de IA

Todos os modelos, todas as variantes numa tabelinha. Clica nos cabeçalhos pra ordenar e acha o modelo perfeito pro seu orçamento. Custo mensal calculado pra uso moderado (50K entrada + 20K saída Token/dia).

Essa calculadora foi útil?

🖱️ Dá pra ordenar clicando nos cabeçalhos!Tenta clicar em "Preço de entrada" ou "Custo mensal" pra ver quem é mais barato.

📋 Comparação de preço de todos os modelos

Modelo	Variante	Entrada ($/M)	Saída ($/M)	Custo mensal
🧪 GLM	GLM-4-Flash Grátis	Grátis	Grátis	Grátis
🦙 Llama	Auto-hospedado (Self-hosted) Grátis	Grátis	Grátis	Grátis
🔬 DeepSeek	V3.2 (cache hit) Grátis	$0.028	$0.42	$0.29
☁️ Qwen	Qwen3.5-Flash Grátis	$0.028	$0.28	$0.21
🫘 Doubao	1.5 Lite Grátis	$0.042	$0.083	$0.11
⚡ MiniMax	abab6.5 Grátis	$0.069	$0.14	$0.19
💎 Gemini	2.5 Flash-Lite Grátis	$0.1	$0.4	$0.39
☁️ Qwen	Qwen3.5-Plus Grátis	$0.11	$0.67	$0.57
🫘 Doubao	1.5 Pro Grátis	$0.11	$0.28	$0.33
🦙 Llama	Llama 4 Scout (API) Grátis	$0.12	$0.35	$0.39
🌙 Kimi	K1.5 Grátis	$0.14	$0.56	$0.55
⚡ MiniMax	Text-01 Grátis	$0.14	$1.39	$1.04
🤖 GPT	GPT-4o-mini Grátis	$0.15	$0.6	$0.58
🦙 Llama	Llama 4 Maverick (API) Grátis	$0.2	$0.6	$0.66
🔬 DeepSeek	V3.2 (cache miss) Grátis	$0.28	$0.42	$0.67
🌙 Kimi	K2 Grátis	$0.28	$0.83	$0.92
💎 Gemini	2.5 Flash Grátis	$0.3	$2.5	$1.95
☁️ Qwen	Qwen3-Max Grátis	$0.35	$1.4	$1.36
🧠 Claude	Haiku 4.5 Grátis	$1.0	$5.0	$4.50
🤖 GPT	o4-mini Grátis	$1.1	$4.4	$4.29
💎 Gemini	2.5 Pro Grátis	$1.25	$10.0	$7.88
🤖 GPT	o3 Grátis	$2.0	$8.0	$7.80
🤖 GPT	GPT-4o Grátis	$2.5	$10.0	$9.75
🧠 Claude	Sonnet 4.6 Grátis	$3.0	$15.0	$13.50
🧠 Claude	Opus 4.6 Grátis	$5.0	$25.0	$22.50
🧪 GLM	GLM-4-Plus Grátis	$6.94	$6.94	$14.57

💡 Custo mensal é calculado como: 50.000 Tokens de entrada + 20.000 Tokens de saída por dia × 30 dias

🔍 Descobertas interessantes

🏆 Modelo pago mais barato

DeepSeek V3.2 (cache hit) custa só $0.028/M de entrada, quase 100 vezes mais barato que GPT-4o! Se seu prompt não muda muito, DeepSeek é praticamente de graça.

🆓 Opção totalmente grátis

GLM-4-Flash e Llama auto-hospedado são completamente grátis. Flash é pra uso leve, Llama é pra equipes com GPU.

💰 Modelo mais caro

Claude Opus 4.6 custa $25/M de saída, o mais caro. Mas a qualidade é top demais, ideal pra requisitos ultra exigentes.

⚖️ Melhor custo-benefício

GPT-4o-mini ($0.15/$0.6) e Doubao 1.5 Lite (¥0.3/¥0.6) são os melhores na categoria "barato mas funciona".