🦙 Llama Token-Gebührenrechner
Meta · USA · Kontextfenster: 1M (Maverick) / 10M (Scout)
💲 Preisübersicht
Hier sind die Token-Preise aller Llama-Varianten (pro Million Tokens):
| Variante | Eingabe (USD/M) | Ausgabe (USD/M) |
|---|---|---|
| Llama 4 Maverick (API) Premium | $0.2 | $0.6 |
| Llama 4 Scout (API) | $0.12 | $0.35 |
| Self-hosted Self-hosted kostenlos | Kostenlos | Kostenlos |
🧮 Gebührenrechner
Wähle eine Variante, passe deine Nutzung an, und sieh wie viel du pro Tag/Monat/Jahr ausgibst:
🎯 Typische Anwendungsfälle
💡
Privatisierter Einsatz (Datensicherheit)
💡
Großflächige Batch-Verarbeitung (Self-hosted kostenlos)
💡
Custom Fine-tuned Modell
💡
API leichte Nutzung
📎 Zugehörige Ressourcen
❓ Häufig gestellte Fragen
Modell-Gewichte kostenlos herunterladen, aber du brauchst deinen GPU-Server. Ein A100-GPU-Server kostet ~$2000-5000/Monat, lohnt sich bei großem Volumen. Kleine Nutzung, eher API.
Meta bietet API nicht direkt, über Drittanbieter-Plattformen (Together AI, Fireworks, Groq, etc.). Unterschiedliche Preise, hier Referenzpreise.
Maverick High-Perf-Version (1M Kontext), Scout Effizienz-Version (10M Kontext aber kleineres Modell). Meist ist Scout besser für Preis-Leistung.