Großer KI-Modell-Preisvergleich

Alle Modelle, alle Varianten in einer Tabelle. Klick auf die Spaltenköpfe zum Sortieren, finde das beste Modell für dein Budget. Die Monatskosten basieren auf "mittlere Nutzung" (50K Eingabe + 20K Ausgabe Tokens pro Tag).

War dieser Rechner hilfreich?
🖱️ Du kannst die Spaltenköpfe klicken zum Sortieren!Versuch auf "Eingabepreis" oder "Monatskosten" zu klicken, sieh wer am billigsten ist.

📋 Vollständiger Modellpreisvergleich

Modell Variante Eingabe ($/M) Ausgabe ($/M) Monatskosten
🧪 Zhipu GLM GLM-4-Flash Kostenlos Kostenlos Kostenlos Kostenlos
🦙 Llama Self-hosted Kostenlos Kostenlos Kostenlos Kostenlos
🔬 DeepSeek V3.2 (Cache-Hit) Kostenlos $0.028 $0.42 $0.29
☁️ Tongyi Qwen Qwen3.5-Flash Kostenlos $0.028 $0.28 $0.21
🫘 Doubao 1.5 Lite Kostenlos $0.042 $0.083 $0.11
⚡ MiniMax abab6.5 Kostenlos $0.069 $0.14 $0.19
💎 Gemini 2.5 Flash-Lite Kostenlos $0.1 $0.4 $0.39
☁️ Tongyi Qwen Qwen3.5-Plus Kostenlos $0.11 $0.67 $0.57
🫘 Doubao 1.5 Pro Kostenlos $0.11 $0.28 $0.33
🦙 Llama Llama 4 Scout (API) Kostenlos $0.12 $0.35 $0.39
🌙 Kimi K1.5 Kostenlos $0.14 $0.56 $0.55
⚡ MiniMax Text-01 Kostenlos $0.14 $1.39 $1.04
🤖 GPT GPT-4o-mini Kostenlos $0.15 $0.6 $0.58
🦙 Llama Llama 4 Maverick (API) Kostenlos $0.2 $0.6 $0.66
🔬 DeepSeek V3.2 (Cache-Miss) Kostenlos $0.28 $0.42 $0.67
🌙 Kimi K2 Kostenlos $0.28 $0.83 $0.92
💎 Gemini 2.5 Flash Kostenlos $0.3 $2.5 $1.95
☁️ Tongyi Qwen Qwen3-Max Kostenlos $0.35 $1.4 $1.36
🧠 Claude Haiku 4.5 Kostenlos $1.0 $5.0 $4.50
🤖 GPT o4-mini Kostenlos $1.1 $4.4 $4.29
💎 Gemini 2.5 Pro Kostenlos $1.25 $10.0 $7.88
🤖 GPT o3 Kostenlos $2.0 $8.0 $7.80
🤖 GPT GPT-4o Kostenlos $2.5 $10.0 $9.75
🧠 Claude Sonnet 4.6 Kostenlos $3.0 $15.0 $13.50
🧠 Claude Opus 4.6 Kostenlos $5.0 $25.0 $22.50
🧪 Zhipu GLM GLM-4-Plus Kostenlos $6.94 $6.94 $14.57

💡 Die Monatskosten basieren auf: 50.000 Eingabe Tokens + 20.000 Ausgabe Tokens pro Tag × 30 Tage

🔍 Was wir entdecken

🏆 Das billigste bezahlte Modell

DeepSeek V3.2 (Cache-Hit) kostet nur $0,028/M für Eingabe, das ist fast 100x billiger als GPT-4o. Wenn dein Prompt nicht oft ändert und der Cache häufig trifft, ist DeepSeek ein absolutes Schnäppchen.

🆓 Vollständig kostenlose Optionen

GLM-4-Flash und Llama Self-hosted sind komplett kostenlos. Flash für leichte Nutzung, Llama Self-hosted für Teams mit GPU.

💰 Das teuerste Modell

Claude Opus 4.6 kostet $25/M für Ausgabe, das ist die Spitze. Aber die Qualität ist auch top-notch, für Szenarien wo du Zero-Kompromiss brauchst.

⚖️ Das beste Preis-Leistungs-Verhältnis

GPT-4o-mini ($0,15/$0,6) und Doubao 1.5 Lite (¥0,3/¥0,6) sind die besten im "günstig aber funktioniert" Segment.