🦙 Calculateur de frais de Token Llama
Meta · États-Unis · Fenêtre de contexte : 1M (Maverick) / 10M (Scout)
💲 Aperçu des tarifs
Voici les tarifs Token de toutes les variantes Llama (par million de Tokens) :
| Variante | Entrée (USD/M) | Sortie (USD/M) |
|---|---|---|
| Llama 4 Maverick (API) Haut de gamme | $0.2 | $0.6 |
| Llama 4 Scout (API) | $0.12 | $0.35 |
| Auto-hébergement (Self-hosted) Auto-hébergement gratuit | Gratuit | Gratuit |
🧮 Calculateur de frais
Choisis une variante, ajuste ta conso, et vois combien tu dépenses par jour/mois/an :
🎯 Cas d'utilisation typiques
💡
Déploiement privatisé (sécurité des données)
💡
Traitement en masse à grande échelle (auto-hébergement gratuit)
💡
Modèle micro-finé personnalisé
💡
Usage léger d'API
📎 Ressources associées
❓ Questions fréquemment posées
Les poids du modèle se téléchargent gratuitement, mais il faut ton serveur GPU. Un serveur GPU A100 coûte environ $2000-5000/mois, ça vaut le coup pour gros volumes. Petit usage, mieux vaut l'API.
Meta ne fournit pas directement l'API, tu passes par des plateformes tierces (Together AI, Fireworks, Groq, etc.). Les prix diffèrent un peu, ici c'est une estimation.
Maverick version haute perf (contexte 1M), Scout version efficacité (contexte 10M mais modèle plus petit). La plupart du temps Scout c'est le bon choix prix-perf.