Google AI Edge Gallery : Chat IA et transcription hors ligne

Temps de lecture : 6 minutes

Quand un enfant, un ado ou un adulte DYS a besoin d’aide pour écrire, reformuler ou transcrire une note vocale, le réflexe est souvent d’ouvrir un service en ligne. Le souci, c’est qu’il faut du réseau, que cela peut distraire, et que les données partent souvent vers un serveur. Google AI Edge Gallery propose une autre voie : faire tourner une intelligence artificielle directement sur le téléphone, en local, pour discuter, analyser une image ou transcrire de l’audio sans dépendre d’une connexion une fois le modèle chargé. 

Pour le public Dysclick, l’intérêt n’est pas de suivre une mode autour de l’IA. La vraie question est plus simple : est-ce que cela peut alléger la lecture, l’écriture, la prise de notes ou la charge mentale d’un profil avec trouble du neurodéveloppement (TND), trouble DYS, trouble du déficit de l’attention avec ou sans hyperactivité (TDAH) ou trouble du spectre de l’autisme (TSA) ? La réponse est oui dans certains cas très concrets, à condition de bien comprendre ce que l’application fait, et ce qu’elle ne remplace pas. 

Google AI Edge Gallery : à quoi sert vraiment l’application

Le projet est open source sur GitHub, sous licence Apache 2.0, et Google le présente comme une application pour exécuter des grands modèles de langage directement sur mobile. Les fonctions mises en avant aujourd’hui sont le chat IA, l’analyse d’images, la transcription audio, un laboratoire de prompts et un système d’extensions appelé Agent Skills. 

  • AI Chat sert à discuter avec un modèle localement, comme on le ferait avec un assistant classique, mais sur l’appareil. 
  • Ask Image permet d’envoyer une photo prise par l’appareil ou choisie dans la galerie pour obtenir une description ou une aide d’analyse. 
  • Audio Scribe transcrit et peut aussi traduire des enregistrements vocaux. 
  • Prompt Lab sert plutôt aux personnes qui veulent tester plusieurs formulations ou comparer des réglages de modèle. 
  • Agent Skills ajoute des modules pour étendre les capacités du modèle, par exemple avec Wikipédia ou des cartes interactives. 

Dit autrement, Edge Gallery n’est pas seulement un chatbot. C’est plutôt un petit bac à sable pour tester plusieurs usages d’IA locale sur téléphone. C’est ce point qui peut intéresser les familles et les accompagnants : on peut essayer différents scénarios sans envoyer systématiquement chaque demande à un service cloud. 

Pourquoi cette IA locale peut aider les profils DYS, TDAH ou TSA

Le premier intérêt est le hors ligne. Une fois le modèle installé, l’application n’a plus besoin d’internet pour l’inférence. Pour un collégien qui travaille dans les transports, pour un étudiant en amphi avec un réseau instable, ou pour une famille qui veut limiter les distractions, c’est un avantage concret. 

  • Transformer une note vocale en texte après un cours, une réunion ou une idée dictée rapidement. 
  • Demander une reformulation plus simple d’un message avant de l’envoyer. 
  • Prendre en photo une consigne, une affiche ou une page et demander à l’IA d’expliquer ce qu’elle voit. C’est une inférence pratique à partir de la fonction Ask Image : l’application n’a pas un module OCR dédié, mais elle peut aider à exploiter une image contenant du texte ou des éléments visuels. 
  • Tester un assistant local pour des besoins simples de rédaction, d’explication ou de brainstorming, sans ouvrir plusieurs services à la fois. 

Pour beaucoup de profils DYS, l’enjeu n’est pas de produire un texte parfait d’un coup. C’est d’avoir un outil qui aide à démarrer, à relire autrement, à passer de l’oral à l’écrit, ou à clarifier une image. Si c’est surtout la dictée vocale qui vous intéresse, vous pouvez aussi lire notre guide 2026 de la reconnaissance vocale pour DYS ou tester Handy, la dictée vocale gratuite et locale sur PC/Mac

Ce qu’il faut vérifier avant d’installer Google AI Edge Gallery

Sur le papier, Google indique un minimum de Android 12 ou iOS 17. La fiche App Store précise en plus que l’application est conçue pour iPhone et qu’elle n’est pas validée pour macOS. Sur Android, la fiche Play Store et le dépôt GitHub renvoient aussi vers l’installation APK pour les personnes qui ne passent pas par Google Play. 

Le second point à regarder est la mémoire disponible. Les modèles proposés officiellement dans les listes publiques vont d’environ 0,58 Go à 4,92 Go, avec des besoins mémoire minimaux qui vont de 4 Go à 12 Go selon le modèle et la plateforme. En pratique, cela veut dire qu’un téléphone ancien ou d’entrée de gamme sera vite limité, surtout pour les modèles multimodaux les plus ambitieux. 

Il faut aussi garder en tête que l’application est encore présentée comme un produit en développement actif, et Google rappelle que les performances dépendent du matériel du téléphone, du processeur et parfois du GPU. Ce n’est donc pas le type d’outil qu’on installe à l’aveugle la veille d’un examen. 

Vie privée : un vrai progrès, sans promettre zéro donnée

Le gros atout d’Edge Gallery, c’est que Google décrit bien l’inférence des modèles comme locale : les prompts, images et données sensibles sont traités sur l’appareil, sans besoin d’internet pendant l’usage du modèle. Pour des notes de cours, un brouillon personnel ou une photo de document, c’est un argument fort par rapport à des assistants entièrement en ligne. 

Mais il faut être précis : cela ne signifie pas que l’application ne collecte rien du tout. La fiche Google Play mentionne une collecte possible d’activité dans l’app et d’informations de performance. La fiche App Store mentionne aussi des identifiants, des diagnostics et certaines données d’usage. En clair : le contenu traité par le modèle peut rester local, mais l’application peut malgré tout remonter de la télémétrie. Si ce sujet compte pour vous, jetez un œil à nos réglages simples pour limiter le partage de vos conversations IA

Quels modèles peut-on charger aujourd’hui sur Android et iPhone

Sur Android, la liste publique du projet comprend actuellement Gemma 4 E2B et E4B, Gemma 3n E2B et E4B, Gemma3 1B, Qwen 2.5 1.5B, DeepSeek-R1-Distill-Qwen 1.5B, ainsi que deux petits modèles liés à Tiny Garden et Mobile Actions. Ces modèles couvrent le chat, le laboratoire de prompts, l’analyse d’image, l’audio et, pour certains, le mode Thinking. 

Sur iPhone, la liste publique est plus courte : Gemma 3n E2B, Gemma 3n E4B et Gemma3 1B. Il y a d’ailleurs un point de vigilance : la fiche App Store met Gemma 4 en avant, mais la liste publique iOS du dépôt ne l’affiche pas, et une issue ouverte en avril 2026 signale justement cette incohérence. Pour une famille qui cherche un repère simple, cela veut dire qu’il faut tester sur l’appareil réel plutôt que supposer que toutes les fonctions Android sont déjà alignées sur iPhone. 

Le projet met aussi en avant l’intégration avec Hugging Face pour découvrir et charger d’autres modèles compatibles. Si vous aimez bidouiller ou si vous travaillez dans un cadre pro, la bibliothèque LiteRT Community sur Hugging Face peut servir de point de départ, mais pour la plupart des familles, le plus raisonnable reste de commencer par les modèles proposés directement dans l’application. 

Comment tester Google AI Edge Gallery simplement

  1. Installez l’application depuis la fiche Google Play si vous êtes sur Android, ou via l’App Store si vous êtes sur iPhone. Vérifiez d’abord la version du système. 
  2. Commencez par un modèle plus léger avant d’essayer un gros modèle multimodal. Les besoins mémoire varient fortement. 
  3. Testez trois usages seulement : une note vocale courte, une photo de consigne, puis une reformulation de texte. Vous verrez vite si l’outil aide vraiment votre enfant ou s’il ajoute de la complexité. 
  4. Gardez un plan B simple. Si l’objectif est d’écrire plus confortablement à l’école, un outil spécialisé de dictée, de correction ou de scanner peut rester plus fiable au quotidien. 

Une IA locale prometteuse, mais pas l’outil unique

Google AI Edge Gallery peut rendre service si vous cherchez une IA locale sur smartphone pour transcrire un audio, discuter hors ligne, décrire une image ou tester des usages sans connexion. Pour les profils DYS et TND, son intérêt est surtout là : réduire la dépendance au cloud, garder la main sur ses données de travail et essayer des aides ponctuelles dans un cadre plus simple. En revanche, il ne remplace pas à lui seul une bonne solution de dictée, un vrai outil OCR, ni un environnement scolaire déjà bien réglé. 

Si vous aimez les outils locaux et sobres, Edge Gallery mérite un test. Si vous cherchez une solution stable, scolaire et immédiatement cadrée, mieux vaut le voir comme un complément, pas comme la trousse numérique complète. 

Partagez :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Retour en haut