Comment fonctionne ce calculateur de tokens IA
Les API de grands modèles facturent généralement par tokens plutôt que par mots. Cette page estime les tokens de votre prompt, ajoute la longueur de sortie attendue et applique les prix d’entrée et de sortie par million de tokens du modèle choisi.
Le nombre de tokens est approximatif. Texte anglais, code, ponctuation, espaces et caractères CJK peuvent être découpés différemment selon le tokenizer du fournisseur.
Utilisez cette estimation pour comparer tailles de prompt, choix de modèle et longueur de sortie attendue avant d’envoyer du trafic en production. Pour un budget final, vérifiez les prix actuels, le tokenizer, le cache et les paramètres de compte.
Traitement local
L’estimation du prompt s’exécute dans votre navigateur. Cette page ne nécessite pas de clé API et n’appelle pas le modèle sélectionné.
Bons cas d’usage
- Estimer si un prompt peut tenir dans la fenêtre de contexte d’un modèle.
- Comparer des modèles haut de gamme et économiques avant de créer un workflow API.
- Estimer le coût d’un batch avec des centaines ou milliers d’appels similaires.
- Ajuster la longueur de sortie attendue pour comprendre pourquoi le texte généré peut dominer le coût.
L’estimation de tokens est-elle exacte ?
Non. C’est une estimation de planification. Les comptes exacts dépendent du tokenizer, du format des messages, des system prompts, des définitions d’outils et des règles de facturation.
Pourquoi les tokens de sortie sont-ils souvent plus chers ?
Générer du texte coûte souvent plus cher que lire l’entrée. Les réponses longues peuvent donc coûter plus que le prompt qui les a déclenchées.
Le calcul inclut-il cache ou remises batch ?
Non. Le calcul principal utilise seulement les prix standard des tokens d’entrée et de sortie. Cache, batch, région et outils peuvent modifier le coût final.