Großer KI-Modell-Preisvergleich

Alle Modelle, alle Varianten in einer Tabelle. Klick auf die Spaltenköpfe zum Sortieren, finde das beste Modell für dein Budget. Die Monatskosten basieren auf "mittlere Nutzung" (50K Eingabe + 20K Ausgabe Tokens pro Tag).

War dieser Rechner hilfreich?

🖱️ Du kannst die Spaltenköpfe klicken zum Sortieren!Versuch auf "Eingabepreis" oder "Monatskosten" zu klicken, sieh wer am billigsten ist.

📋 Vollständiger Modellpreisvergleich

Modell	Variante	Eingabe ($/M)	Ausgabe ($/M)	Monatskosten
🧪 Zhipu GLM	GLM-4-Flash Kostenlos	Kostenlos	Kostenlos	Kostenlos
🦙 Llama	Self-hosted Kostenlos	Kostenlos	Kostenlos	Kostenlos
🔬 DeepSeek	V3.2 (Cache-Hit) Kostenlos	$0.028	$0.42	$0.29
☁️ Tongyi Qwen	Qwen3.5-Flash Kostenlos	$0.028	$0.28	$0.21
🫘 Doubao	1.5 Lite Kostenlos	$0.042	$0.083	$0.11
⚡ MiniMax	abab6.5 Kostenlos	$0.069	$0.14	$0.19
💎 Gemini	2.5 Flash-Lite Kostenlos	$0.1	$0.4	$0.39
☁️ Tongyi Qwen	Qwen3.5-Plus Kostenlos	$0.11	$0.67	$0.57
🫘 Doubao	1.5 Pro Kostenlos	$0.11	$0.28	$0.33
🦙 Llama	Llama 4 Scout (API) Kostenlos	$0.12	$0.35	$0.39
🌙 Kimi	K1.5 Kostenlos	$0.14	$0.56	$0.55
⚡ MiniMax	Text-01 Kostenlos	$0.14	$1.39	$1.04
🤖 GPT	GPT-4o-mini Kostenlos	$0.15	$0.6	$0.58
🦙 Llama	Llama 4 Maverick (API) Kostenlos	$0.2	$0.6	$0.66
🔬 DeepSeek	V3.2 (Cache-Miss) Kostenlos	$0.28	$0.42	$0.67
🌙 Kimi	K2 Kostenlos	$0.28	$0.83	$0.92
💎 Gemini	2.5 Flash Kostenlos	$0.3	$2.5	$1.95
☁️ Tongyi Qwen	Qwen3-Max Kostenlos	$0.35	$1.4	$1.36
🧠 Claude	Haiku 4.5 Kostenlos	$1.0	$5.0	$4.50
🤖 GPT	o4-mini Kostenlos	$1.1	$4.4	$4.29
💎 Gemini	2.5 Pro Kostenlos	$1.25	$10.0	$7.88
🤖 GPT	o3 Kostenlos	$2.0	$8.0	$7.80
🤖 GPT	GPT-4o Kostenlos	$2.5	$10.0	$9.75
🧠 Claude	Sonnet 4.6 Kostenlos	$3.0	$15.0	$13.50
🧠 Claude	Opus 4.6 Kostenlos	$5.0	$25.0	$22.50
🧪 Zhipu GLM	GLM-4-Plus Kostenlos	$6.94	$6.94	$14.57

💡 Die Monatskosten basieren auf: 50.000 Eingabe Tokens + 20.000 Ausgabe Tokens pro Tag × 30 Tage

🔍 Was wir entdecken

🏆 Das billigste bezahlte Modell

DeepSeek V3.2 (Cache-Hit) kostet nur $0,028/M für Eingabe, das ist fast 100x billiger als GPT-4o. Wenn dein Prompt nicht oft ändert und der Cache häufig trifft, ist DeepSeek ein absolutes Schnäppchen.

🆓 Vollständig kostenlose Optionen

GLM-4-Flash und Llama Self-hosted sind komplett kostenlos. Flash für leichte Nutzung, Llama Self-hosted für Teams mit GPU.

💰 Das teuerste Modell

Claude Opus 4.6 kostet $25/M für Ausgabe, das ist die Spitze. Aber die Qualität ist auch top-notch, für Szenarien wo du Zero-Kompromiss brauchst.

⚖️ Das beste Preis-Leistungs-Verhältnis

GPT-4o-mini ($0,15/$0,6) und Doubao 1.5 Lite (¥0,3/¥0,6) sind die besten im "günstig aber funktioniert" Segment.