Mishaal Rahman / Autorité Android
TL;DR
- Google indique qu'Adobe teste la prise en charge de Gemini Nano dans Acrobat.
- Adobe Acrobat peut utiliser Gemini Nano pour activer des fonctionnalités d'IA générative sur l'appareil, telles que la synthèse, qui fait partie de l'outil Acrobat AI Assistant.
- Patreon et Grammarly travaillent également à ajouter des fonctionnalités d'IA basées sur Gemini Nano à leurs applications.
L’IA générative est la tendance la plus en vogue en matière de technologie, et il n’y a aucun signe qu’elle ralentisse de si tôt. La semaine dernière, Google a consacré la majeure partie de son discours d'ouverture à Google I/O 2024 à parler des progrès de l'entreprise en matière d'IA. L’entreprise s’est bien sûr concentrée principalement sur la présentation de ses propres produits d’IA, mais elle a également pris le temps de présenter certains des travaux effectués par ses partenaires. Par exemple, Google a annoncé l'arrivée d'une nouvelle expérience d'Acrobat AI Assistant, la suite de fonctionnalités d'IA générative d'Abode dans Acrobat et Reader, qui utilise Gemini Nano.
Gemini, si vous ne le savez pas, est la marque du grand modèle linguistique (LLM) et du chatbot IA de Google. Il existe plusieurs versions du Gemini LLM : Nano, Pro et Ultra. Gemini Nano est le plus petit et le moins complexe des trois modèles, ce qui lui permet de fonctionner sur des appareils mobiles comme les séries Google Pixel 8 Pro et Samsung Galaxy S24. Bien que Gemini Nano ne soit pas adapté à des tâches telles que l'alimentation d'un chatbot IA à usage général, la version actuelle est plus que capable de traiter des blocs de texte petits à moyens pour fournir des résumés ou des suggestions de réponses. C'est exactement pourquoi Google l'utilise pour alimenter la fonction de synthèse sur l'appareil de l'application d'enregistrement vocal Pixel ainsi que les réponses intelligentes de Gboard dans diverses applications de messagerie. Samsung utilise également Gemini Nano pour alimenter certaines de ses fonctionnalités Galaxy AI sur l'appareil.
Pour faciliter le déploiement de Gemini Nano sur les appareils, Google a créé un nouveau service système sous Android appelé AICore. AICore simplifie les choses pour les développeurs en gérant les téléchargements/mises à jour du modèle Gemini Nano et en exploitant le matériel sur l'appareil pour accélérer l'inférence lorsque les applications appellent l'API Gemini Nano. Cette API peut être appelée via le SDK AI Edge pour Android, qui est actuellement en préversion privée. Lors de la présentation « Quoi de neuf d'Android » de la semaine dernière, Google a révélé certaines des entreprises autorisées à avoir un accès anticipé au SDK AI Edge pour Android. Ces premiers utilisateurs incluent Patreon, Grammarly et bien sûr Adobe.
Gemini Nano dans Adobe Acrobat
Mishaal Rahman / Autorité Android
Bien que Google n'ait pas révélé comment Patreon ou Grammarly utiliseraient Gemini Nano, ils ont expliqué comment Adobe envisage de l'utiliser dans Acrobat. D'après le bref teaser qui nous a été présenté, il semble qu'Adobe Acrobat utilisera bientôt Gemini Nano pour résumer des documents et permettre aux utilisateurs de poser des questions à leur sujet. Dans la vidéo diffusée par Google, l'IA Assistant d'Adobe résume un document PDF intitulé « The Rise of Pickleball ». La démo montre un bouton flottant « AI Assistant » qui, lorsqu'il est enfoncé, génère un bref aperçu du document. Certaines questions de suivi générées automatiquement sont affichées sous l'aperçu sur lesquelles l'utilisateur peut appuyer, mais il existe également un champ de texte dans lequel l'utilisateur peut poser n'importe quelle question sur le document.
On ne sait pas dans quelle mesure cette expérience sera optimisée par Gemini Nano sur l'appareil par rapport à un autre modèle dans le cloud. L'assistant AI d'Adobe Acrobat n'est pas nouveau, mais il traite actuellement les documents entièrement dans le cloud. Les modèles plus petits comme Gemini Nano ne peuvent pas gérer des documents PDF très longs comme le Gemini 1.5 Pro, mais ils devraient être capables de gérer des documents plus courts. Le nombre exact de mots et de pages du PDF utilisé dans la démo n'était pas affiché, mais le document semblait faire un peu plus de 20 pages. Il est possible que la démo ne soit pas représentative des capacités réelles de l'appareil de la prochaine mise à jour d'AI Assistant, nous devrons donc attendre et voir comment elle se comportera une fois déployée.
L'avenir de Gemini Nano
Google s'apprête à lancer une version plus puissante de Gemini Nano, appelée Gemini Nano avec multimodalité, sur sa prochaine série Pixel 9. Les modèles Gemini Nano actuels sont disponibles avec des tailles de paramètres de 1,8B ou 3,25B, tandis que le nouveau modèle sera disponible dans une taille de paramètres de 3,8B et prendra également en charge le traitement audio et d'image. On ne sait pas si Adobe, Patreon et Grammarly envisagent d'utiliser le modèle mis à niveau, mais il sera intéressant de voir s'ils le font. Espérons que Google ouvrira bientôt le SDK AI Edge pour Android à tous les développeurs afin que nous puissions voir quel type de fonctionnalités ils créent à l’aide de Gemini Nano.