Quel est le coût énergétique d’une requête IA ? → DYSCLICK

Temps de lecture : 5 minutes

Cet article explique de façon simple l’empreinte environnementale d’une requête d’IA (texte) et ce que ces chiffres représentent concrètement. Les valeurs citées correspondent à une réponse d’environ 400 tokens (≈ 1 page de texte, soit ~400–500 mots).

Un chiffre à retenir : une tasse de café (ordre de grandeur) représente environ quelques centaines de requêtes IA, selon l’hypothèse utilisée — les calculs détaillés sont fournis en annexe.

Résultats clés (par requête médiane / réponse d’une page) :

Google Gemini : 0,24 Wh d’énergie • 0,03 gCO₂e • 0,26 mL d’eau (≈ 5 gouttes).
ChatGPT (estimation publique) : ≈ 0,34 Wh d’énergie.
Mistral Large 2 : 1,14 gCO₂e • 45 mL d’eau.

Pour mettre ces nombres en perspective : 0,24 Wh, c’est l’équivalent d’à peine quelques secondes de télévision ; 0,26 mL d’eau, c’est ≈ 5 gouttes. Autrement dit, une requête individuelle a un impact très faible. Mais attention : l’impact total d’un modèle inclut aussi son entraînement — et là les ordres de grandeur montent fortement.

Pourquoi les chiffres varient

fr-Our contribution to a global environmental standard for AI-2

Différentes entreprises publient des chiffres différents parce qu’elles ne mesurent pas exactement la même chose et, bien sûr, n’ont pas les mêmes performances ni la même consommation. Certains rapports mesurent l’empreinte à l’échelle opérationnelle (énergie utilisée dans les data centers, surprovisionnement pour la disponibilité, PUE, CPU/RAM, refroidissement, etc.). D’autres font une analyse de cycle de vie (ACV) plus large qui intègre la fabrication des serveurs, la consommation d’eau en amont, et d’autres impacts liés à la chaîne de production.

Les écarts viennent aussi des hypothèses : quel mix électrique est utilisé pour convertir des Wh en gCO₂ ? Est‑ce qu’on inclut l’énergie des appareils utilisateurs (smartphone, PC) ? Est‑ce qu’on compte le trafic réseau ? Toutes ces décisions méthodologiques modifient fortement les résultats.

Il faut donc prendre ces chiffres avec précaution : on peut faire dire beaucoup de choses aux nombres si on cache les hypothèses. En même temps, il faut saluer la transparence : Google et Mistral ont mis à disposition données et méthodes, ce qui permet aux chercheurs et au public de comparer et d’améliorer les protocoles.

L’eau : pourquoi on en parle pour l’IA

Les data centers utilisent souvent de l’eau (parfois perdue) pour le refroidissement. Quand une entreprise publie une valeur par requête (ex. 0,26 mL ou 45 mL), elle indique la part d’eau moyenne nécessaire au refroidissement et à l’infrastructure pour fournir cette réponse, proportionnelle à l’énergie consommée.

Comparaisons utiles :

Google : 0,26 mL ≈ 5 gouttes d’eau (hypothèse 1 mL ≈ 20 gouttes).
Mistral : 45 mL ≈ 9 cuillères à café (1 cuillère ≈ 5 mL).

Pour donner encore plus de perspective, préparer une tasse de café implique typiquement 150–200 mL d’eau (quantité d’eau utilisée pour l’infusion). Ainsi :

1 tasse (150 mL) ≈ 577 requêtes Gemini (150 ÷ 0,26).
1 tasse (150 mL) ≈ 3 requêtes Mistral (150 ÷ 45).

Autrement dit, sur l’axe de l’eau, une requête Mistral (45 mL) utilise une quantité d’eau comparable à presque un tiers d’une tasse de café, tandis qu’une requête Gemini (0,26 mL) n’est que quelques gouttes.

Ces quantités restent faibles pour une seule requête, mais multipliées par des millions d’appels par jour, la consommation peut devenir significative, surtout dans des zones sous stress hydrique.

Il existe des technologies de refroidissement qui n’utilisent pas d’eau perdue (ex : refroidissement à air, cycles fermés), mais leur déploiement dépend du climat, du coût et des choix d’ingénierie locaux.

L’énergie : comment la mesurer et pourquoi l’échelle compte

L’énergie par requête est souvent donnée en watt-heures (Wh). Une petite consommation par requête devient négligeable pour un utilisateur isolé. En revanche, à l’échelle d’une plateforme qui sert des milliards de requêtes, la somme devient importante.

Comparaisons d’énergie (résultats) :

Google Gemini (0,24 Wh par requête) : équivaut à ≈ 8,6 secondes d’utilisation d’une télévision ou d’un ordinateur portable à 100 W, ou ≈ 4,8 minutes d’utilisation d’un téléphone mobile à 3 W.
ChatGPT (≈ 0,34 Wh par requête) : équivaut à ≈ 12,2 secondes d’utilisation d’une télévision ou d’un ordinateur portable à 100 W, ou ≈ 6,8 minutes d’utilisation d’un téléphone mobile à 3 W.

Comparaison avec une tasse de café (énergie) — hypothèses :

Hypothèse basse : 1 tasse de café = 25 Wh (méthode économique : eau chauffée au micro‑ondes ou bouilloire efficace et petit volume).
Hypothèse haute : 1 tasse de café = 50 Wh (méthode plus gourmande : cafetière filtre, temps de chauffe plus long, pertes énergétiques).

Équivalences selon hypothèses :

Avec 25 Wh :
- 1 tasse = ≈ 104 requêtes Gemini (25 ÷ 0,24).
- 1 tasse = ≈ 74 requêtes ChatGPT (25 ÷ 0,34).
Avec 50 Wh :
- 1 tasse = ≈ 208 requêtes Gemini (50 ÷ 0,24).
- 1 tasse = ≈ 147 requêtes ChatGPT (50 ÷ 0,34).

Remarque : l’étude de Mistral ne fournit pas explicitement de valeur Wh d’inférence dans ses communiqués publics, nous n’avons donc pas converti son chiffre de CO₂ en Wh ici afin de rester rigoureux.

Ces équivalences donnent une perspective immédiate : une requête prise isolément correspond à quelques secondes d’écran, quelques minutes d’utilisation d’un téléphone, ou à une petite fraction d’énergie comparée à la préparation d’une tasse de café. Multipliée à grande échelle, l’addition devient notable.

Points à retenir :

L’efficacité matérielle (puces dédiées) et logicielle (algorithmes, batching, distillation) réduit fortement l’énergie par requête.
L’échelle joue : Google, avec ses centres optimisés et son matériel maison, obtient souvent des chiffres par requête plus faibles que des acteurs plus petits.

Le CO₂ : petit par requête, énorme à l’entraînement

Les émissions par requête peuvent paraître négligeables (fractions de gramme). Concrètement, les chiffres publiés donnent environ 0,03 gCO₂e par requête pour Google Gemini et ≈ 1,14 gCO₂e pour une réponse longue de Mistral (≈ 400 tokens).

Pour rendre ces valeurs parlantes :

Conversion par rapport à une tasse de café (10 gCO₂e/tasse, hypothèse) :
- 1 tasse (10 gCO₂e) = ≈ 333 requêtes Gemini (10 ÷ 0,03).
- 1 tasse (10 gCO₂e) = ≈ 9 requêtes Mistral (10 ÷ 1,14).
Conversion par rapport à la voiture (120 gCO₂/km, hypothèse voiture moyenne) :
- 1 km voiture = 120 gCO₂ → = ≈ 4 000 requêtes Gemini (120 ÷ 0,03).
- 1 km voiture = 120 gCO₂ → = ≈ 105 requêtes Mistral (120 ÷ 1,14).

Amortissement d’un entraînement (exemple Mistral) :

Mistral indique 20,4 ktCO₂e pour l’entraînement d’un modèle majeur = 20 400 tonnes CO₂ = 20 400 000 kg = 20 400 000 000 g.
En années-voiture : si l’on prend une voiture moyenne émettant ≈ 1,44 tCO₂/an (12 000 km × 120 g/km), alors 20,4 ktCO₂ ≈ ≈ 14 167 années-voiture — autrement dit les émissions annuelles d’environ 14 000 voitures roulant 12 000 km chacune.
Pour donner une échelle urbaine, ces 20,4 ktCO₂ représentent environ 1,6 jours des émissions annuelles directes de la ville de Paris (les émissions directes de Paris étaient d’environ 4,72 MtCO₂ en 2022).

Ces ordres de grandeur montrent qu’un entraînement pèse très lourd et que son impact doit être mis en regard du nombre total de requêtes servies par la suite pour mesurer l’empreinte par utilisation.

Conseils pratiques pour utiliser l’IA de façon plus sobre

Choisir un modèle adapté : privilégier les modèles légers quand la tâche est simple.
Consolider les requêtes : regrouper les questions plutôt que multiplier les petits prompts.
Limiter la longueur : moins de tokens générés = moins d’énergie consommée.
Favoriser la transparence : utiliser des services qui publient leurs méthodes et indicateurs.
Évaluer l’usage à l’échelle : pour une organisation, mesurer les requêtes totales par mois aide à décider d’un plan d’action (cache, modèles locaux, quotas).

Annexe — calculs et hypothèses détaillés

Ce chapitre rassemble tous les calculs utilisés dans l’article et précise les hypothèses employées afin que tout soit reproductible.
Hypothèses générales utilisées
Taille d’une réponse : ~400 tokens ≈ 1 page de texte (400–500 mots).
Valeurs publiées par les fournisseurs :
Google Gemini : 0,24 Wh / 0,03 gCO₂e / 0,26 mL d’eau par requête médiane.
ChatGPT (valeur publique citée) : ≈ 0,34 Wh par requête (gCO₂e non fourni directement dans nos sources).
Mistral Large 2 : 1,14 gCO₂e et 45 mL d’eau par réponse longue (≈ 400 tokens). Aucune Wh d’inférence explicite publiée dans l’étude consultée.
Hypothèses de comparaison :
Télévision ou ordinateur portable : 100 W (puissance utilisée pour comparer secondes d’écran).
Téléphone portable : 3 W (consommation moyenne pendant navigation / usage simple).
Tasse de café (hypothèse énergie) : fourchette 25 Wh (basse) à 50 Wh (haute) selon méthode de préparation.
Tasse de café (hypothèse eau) : 150 mL d’eau pour l’infusion.
Tasse de café (hypothèse CO₂) : ≈ 10 gCO₂e par tasse (ordre de grandeur selon mode de production et préparation).
Gouttes : 1 mL ≈ 20 gouttes (approximation usuelle).
Voiture moyenne : 120 gCO₂/km (valeur d’ordre de grandeur pour comparaison simple).
Calculs énergétiques (exemples montrés dans l’article)
Wh → secondes de télévision (TV = 100 W)
Méthode : temps (h) = Wh ÷ W ; temps (s) = temps (h) × 3600.
Pour Gemini : 0,24 Wh ÷ 100 W = 0,0024 h → × 3600 = 8,64 s → arrondi ≈ 8,6 s.
Pour ChatGPT : 0,34 Wh ÷ 100 W = 0,0034 h → × 3600 = 12,24 s → arrondi ≈ 12,2 s.
Wh → minutes de téléphone (Téléphone = 3 W)
Méthode : temps (h) = Wh ÷ 3 ; temps (min) = temps (h) × 60.
Pour Gemini : 0,24 Wh ÷ 3 W = 0,08 h → × 60 = 4,8 min.
Pour ChatGPT : 0,34 Wh ÷ 3 W = 0,1133 h → × 60 = 6,8 min.
Énergie : tasse de café (exemples pour 25 Wh et 50 Wh)
Méthode : nombre de requêtes = Énergie tasse ÷ Wh par requête.
Avec 25 Wh :
Gemini : 25 ÷ 0,24 = 104,17 → ≈ 104 requêtes.
ChatGPT : 25 ÷ 0,34 = 73,53 → ≈ 74 requêtes.
Avec 50 Wh :
Gemini : 50 ÷ 0,24 = 208,33 → ≈ 208 requêtes.
ChatGPT : 50 ÷ 0,34 = 147,06 → ≈ 147 requêtes.
Calculs eau
mL → gouttes (hypothèse 1 mL ≈ 20 gouttes)
Gemini : 0,26 mL × 20 = 5,2 gouttes → ≈ 5 gouttes.
Mistral : 45 mL × 20 = 900 gouttes.
Nombre de requêtes pour remplir une tasse (150 mL)
Gemini : 150 ÷ 0,26 = 576,92 → ≈ 577 requêtes.
Mistral : 150 ÷ 45 = 3,33 → ≈ 3 requêtes.
Calculs CO₂
gCO₂ → tasses de café (10 gCO₂/tasse)
Méthode : nombre de requêtes = 10 gCO₂ ÷ gCO₂ par requête.
Gemini : 10 ÷ 0,03 = 333,33 → ≈ 333 requêtes.
Mistral : 10 ÷ 1,14 = 8,77 → ≈ 9 requêtes.
gCO₂ → km de voiture (120 gCO₂/km)
Méthode : nombre de requêtes = 120 gCO₂/km ÷ gCO₂ par requête.
Gemini : 120 ÷ 0,03 = 4 000 → ≈ 4 000 requêtes pour 1 km.
Mistral : 120 ÷ 1,14 = 105,26 → ≈ 105 requêtes pour 1 km.
Amortissement d’un entraînement (exemple chiffré)
Mistral indique 20,4 ktCO₂e pour un entraînement majeur = 20 400 tonnes = 20 400 000 kg = 20 400 000 000 g.
En tasses de café (10 g/tasse) : 20 400 000 000 ÷ 10 = 2,04 × 10^9 tasses → ≈ 2,04 milliards de tasses.
En km de voiture (120 g/km) : 20 400 000 000 ÷ 120 = 170 000 000 km → ≈ 170 millions de km.
Si on répartit ces 20,4 ktCO₂e sur, disons, 1 milliard de requêtes, l’empreinte liée à l’entraînement par requête serait : 20 400 000 000 g ÷ 1 000 000 000 = 20,4 gCO₂e par requête (ordre de grandeur) — ce simple calcul illustre l’importance du facteur d’amortissement : plus d’utilisations totalisées → plus l’empreinte d’entraînement par requête diminue.
Remarque : l’exemple ci‑dessus (répartition sur 1 milliard de requêtes) est purement illustratif. Le vrai ratio d’amortissement dépend du nombre réel de requêtes servies, de la durée de vie effective du modèle et des mises à jour/finetuning.

Partagez :

NotebookLM simplifie l’Apprentissage des DYS

4 mai 2025 Aucun commentaire

Google NotebookLM révolutionne l’accès aux contenus pour les personnes DYS en proposant deux fonctionnalités phares…

Top jeux de société pour enfants dyspraxiques

17 juillet 2025 Aucun commentaire

🏓 Jeux de société & dyspraxie : ne laissez pas la maladresse gâcher le fun…

Illustration d’un enfant DYS lisant un livre sur la plage ; autour de lui flottent des icônes ludiques (puzzle-cerveau, crayon, dé, ballon, coquillage, manette) symbolisant l’équilibre entre révisions et détente ; palette bleu #1284CA, vert #1B8D78, jaune #FFCD57 ; large marge vierge sans texte tout autour.

Enfant DYS en vacances : réviser sans gâcher l’été

12 juillet 2025 Aucun commentaire

Devoirs de vacances ou relâche totale ? 😰 Quand on a un enfant DYS, pas évident…

Pourquoi les chiffres varient

L’eau : pourquoi on en parle pour l’IA

L’énergie : comment la mesurer et pourquoi l’échelle compte

Le CO₂ : petit par requête, énorme à l’entraînement

Conseils pratiques pour utiliser l’IA de façon plus sobre

Laisser un commentaire Annuler la réponse