Le nouveau système d'IA d'Apple peut « voir » et pourrait changer la donne pour Siri

Consultez notre autre site internet Juexparc.fr pour plus d’actualités et d’informations sur les jeux

Apple se lance tête première dans les systèmes basés sur l'intelligence artificielle et, selon des rapports citant des chercheurs Apple à l'origine de ces nouveaux systèmes, l'un d'entre eux est spécifiquement conçu pour prendre en charge les produits GPT d'OpenAI.

Ouvrir la galerie 2

VOIR LA GALERIE – 2 IMAGES

Advertisement

Les rapports indiquent qu'Apple développe le système ReaLM, qui signifie « Résolution de référence en tant que modélisation du langage« , un nouveau système conçu pour rendre l'interaction avec l'IA beaucoup plus naturelle. De plus, ReaLM est capable de « voir » contenu à l'écran, les chercheurs à l'origine du projet affirmant qu'il surpasse le GPT-4 d'OpenAI, la technologie sous-jacente à ChatGPT, pour déterminer le contexte et interpréter les expressions linguistiques.

De plus, les chercheurs à l'origine du projet pensent que ReaLM est « un choix idéal » pour un système de déchiffrement de contexte qui serait présent « sur l'appareil sans compromettre les performances« . Alors, comment ça fonctionnerait ? Imaginez demander à Siri de vous montrer une liste de produits d'épicerie locaux autour de chez vous. Une fois que Siri aura fini d'afficher cette liste, vous pourrez alors lui demander « Appelez celui du bas. » Avec la mise en œuvre de ReaLM, Siri serait en mesure d'identifier l'option la plus basse et de procéder à leur appel. Les chercheurs d'Apple affirment que ReaLM a surpassé GPT-4 dans ce domaine de déchiffrement de contexte.

« Le discours humain contient généralement des références ambiguës telles que « ils » ou « cela », dont la signification est évidente (pour les autres humains) étant donné le contexte, » les chercheurs a écrit sur les capacités de ReaLM. « Être capable de comprendre le contexte, y compris les références comme celles-ci, est essentiel pour un assistant conversationnel qui vise à permettre à un utilisateur de communiquer naturellement ses exigences à un agent, ou d'avoir une conversation avec lui.« 

Advertisement