Großer KI-Modell-Preisvergleich
Alle Modelle, alle Varianten in einer Tabelle. Klick auf die Spaltenköpfe zum Sortieren, finde das beste Modell für dein Budget. Die Monatskosten basieren auf "mittlere Nutzung" (50K Eingabe + 20K Ausgabe Tokens pro Tag).
📋 Vollständiger Modellpreisvergleich
| Modell | Variante | Eingabe ($/M) | Ausgabe ($/M) | Monatskosten |
|---|---|---|---|---|
| 🧪 Zhipu GLM | GLM-4-Flash Kostenlos | Kostenlos | Kostenlos | Kostenlos |
| 🦙 Llama | Self-hosted Kostenlos | Kostenlos | Kostenlos | Kostenlos |
| 🔬 DeepSeek | V3.2 (Cache-Hit) Kostenlos | $0.028 | $0.42 | $0.29 |
| ☁️ Tongyi Qwen | Qwen3.5-Flash Kostenlos | $0.028 | $0.28 | $0.21 |
| 🫘 Doubao | 1.5 Lite Kostenlos | $0.042 | $0.083 | $0.11 |
| ⚡ MiniMax | abab6.5 Kostenlos | $0.069 | $0.14 | $0.19 |
| 💎 Gemini | 2.5 Flash-Lite Kostenlos | $0.1 | $0.4 | $0.39 |
| ☁️ Tongyi Qwen | Qwen3.5-Plus Kostenlos | $0.11 | $0.67 | $0.57 |
| 🫘 Doubao | 1.5 Pro Kostenlos | $0.11 | $0.28 | $0.33 |
| 🦙 Llama | Llama 4 Scout (API) Kostenlos | $0.12 | $0.35 | $0.39 |
| 🌙 Kimi | K1.5 Kostenlos | $0.14 | $0.56 | $0.55 |
| ⚡ MiniMax | Text-01 Kostenlos | $0.14 | $1.39 | $1.04 |
| 🤖 GPT | GPT-4o-mini Kostenlos | $0.15 | $0.6 | $0.58 |
| 🦙 Llama | Llama 4 Maverick (API) Kostenlos | $0.2 | $0.6 | $0.66 |
| 🔬 DeepSeek | V3.2 (Cache-Miss) Kostenlos | $0.28 | $0.42 | $0.67 |
| 🌙 Kimi | K2 Kostenlos | $0.28 | $0.83 | $0.92 |
| 💎 Gemini | 2.5 Flash Kostenlos | $0.3 | $2.5 | $1.95 |
| ☁️ Tongyi Qwen | Qwen3-Max Kostenlos | $0.35 | $1.4 | $1.36 |
| 🧠 Claude | Haiku 4.5 Kostenlos | $1.0 | $5.0 | $4.50 |
| 🤖 GPT | o4-mini Kostenlos | $1.1 | $4.4 | $4.29 |
| 💎 Gemini | 2.5 Pro Kostenlos | $1.25 | $10.0 | $7.88 |
| 🤖 GPT | o3 Kostenlos | $2.0 | $8.0 | $7.80 |
| 🤖 GPT | GPT-4o Kostenlos | $2.5 | $10.0 | $9.75 |
| 🧠 Claude | Sonnet 4.6 Kostenlos | $3.0 | $15.0 | $13.50 |
| 🧠 Claude | Opus 4.6 Kostenlos | $5.0 | $25.0 | $22.50 |
| 🧪 Zhipu GLM | GLM-4-Plus Kostenlos | $6.94 | $6.94 | $14.57 |
💡 Die Monatskosten basieren auf: 50.000 Eingabe Tokens + 20.000 Ausgabe Tokens pro Tag × 30 Tage
🔍 Was wir entdecken
DeepSeek V3.2 (Cache-Hit) kostet nur $0,028/M für Eingabe, das ist fast 100x billiger als GPT-4o. Wenn dein Prompt nicht oft ändert und der Cache häufig trifft, ist DeepSeek ein absolutes Schnäppchen.
GLM-4-Flash und Llama Self-hosted sind komplett kostenlos. Flash für leichte Nutzung, Llama Self-hosted für Teams mit GPU.
Claude Opus 4.6 kostet $25/M für Ausgabe, das ist die Spitze. Aber die Qualität ist auch top-notch, für Szenarien wo du Zero-Kompromiss brauchst.
GPT-4o-mini ($0,15/$0,6) und Doubao 1.5 Lite (¥0,3/¥0,6) sind die besten im "günstig aber funktioniert" Segment.