À mesure que le marché des smartphones a mûri, les charges de travail que les consommateurs attendent de leurs minuscules ordinateurs mobiles en poche ont considérablement augmenté. Heureusement, les concepteurs de puces continuent de construire des processeurs plus rapides qui fonctionnent bien avec des charges de travail variées, sans la durée de vie complètement de la batterie. Ce soir, ARM a introduit sa plate-forme Lumex Compute Sous-System (CSS), qui stimule les grandes améliorations des charges de travail générales du processeur, mais aussi sur des tâches d’intelligence artificielle et de jeu artificielles.
Améliorations du processeur de bras Lumex
La grande nouvelle est que chaque partie du Lumex CSS a été spécialement conçue pour améliorer l’IA sur les appareils. Les cœurs de CPU Lumex implémentent les instructions d’extension de matrice évolutive V2 (SME2) qui sont conçues pour les opérations matricielles dont les modèles AI modernes ont besoin. Bien que nous pensons que les coprocesseurs neuronaux spécifiques à l’IA vont rester un élément essentiel de tout SOC mobile, l’ajout de ces instructions transforme essentiellement le bloc CPU en coprocesseur d’IA en soi. ARM dit que ces nouvelles instructions accélérées permettront aux titulaires de licence ARM de commercialiser les appareils d’IA plus rapidement avec des performances plus semblables à leurs frères de bureau.
ARM indique que les architectures CPU basées sur Lumex CSS devraient être disponibles de haut en bas de la pile de produits d’un client, des produits phares à des appareils efficaces à faible puissance. Les différentes conceptions peuvent alimenter n’importe quoi, un PC à un portable avec les plus petits facteurs de forme. Pour gérer tout cela, les conceptions Lumex CSS incluent quatre types de noyau différents.
Au sommet se trouve C1-Ultra, qui est la conception de base la plus performante avec une augmentation des performances de 25% parmi la génération précédente Neoverse d’une année sur l’autre. Ce sont ce que vous pourriez considérer comme des noyaux «primaires» et «performances» avec les taux d’horloge les plus élevés, les meilleures performances et la consommation d’énergie la plus élevée. Ceux-ci conviennent à l’inférence du modèle important, aux caractéristiques de photographie alimentées par l’IA et au contenu générateur d’IA.

Ci-dessous, C1-Premium, qui dit ARM, emballe les performances C1-Ultra dans une zone plus petite de 35% par rapport à C1-UlTRA. Cela se fera très probablement au prix de l’efficacité énergétique, ce qui affectera les vitesses de l’horloge et réduira donc quelque peu les performances. Ces cœurs seront les principaux cœurs de processeur dans les appareils mobiles de sous-flagship, ainsi que des cœurs multitâches pour des choses comme les assistants vocaux et les tâches de fond sur les produits phares.
La conception du noyau d’efficacité est C1-Pro. Ceux-ci ont une augmentation de 16% des performances soutenues par rapport aux conceptions de génération précédente, ce qui signifie qu’elles ne reculeront pas des vitesses de pointe aussi rapidement lorsqu’elles sont augmentées. Ce sont les noyaux qui, selon ARM, voudront décharger des tâches de lecture vidéo et de streaming pour les inférences. Ils seront probablement trouvés dans n’importe quel design alimenté par Lumex.
Enfin, C1-Nano est la conception la plus économe en puissance. Ceux-ci réduisent la consommation d’énergie de plus de 26% et utilisent moins de surface que C1-Pro. Le plus souvent, les noyaux C1-Nano seront trouvés dans des vêtements comme des montres, des anneaux intelligents, etc.

Kleidiai rend l’IA plus conviviale
Pour accompagner les nouvelles instructions SME2 discutées ci-dessus, ARM a également annoncé l’intégration de Kleidiai pour tous les principaux cadres d’IA. ARM indique que les applications construites sur Executorch de Pytorch, Linet de Google, Alibaba MNN et le runtime ONNX de Microsoft bénéficieront toutes de l’opportunité d’augmenter les performances sans modification de code.
Lumex apporte une nouvelle portabilité aux applications multiplateformes. Par exemple, les principales applications Google comme Gmail, YouTube et Google Photos sont déjà capables de fléchir les améliorations des performances SME2. Parce que SME2 existera sur toutes les plates-formes ARM construites avec des périphériques Lumex, l’utilisation des frameworks mentionnés ci-dessus améliorera les fenêtres sur le bras et d’autres plates-formes. Alipay a également présenté également des LLM sur des appareils en cours d’exécution avec SME2.

ARM dit que des milliers d’applications Android avec l’IA n’auront même pas besoin d’un changement de code pour utiliser SME2
Dans l’ensemble, ARM dit qu’un groupe de processeurs C1-Family augmente les performances jusqu’à 5x dans les tâches d’IA. Les performances des expériences «efficaces AI» fonctionnant sur des noyaux efficaces qui ne vidaient pas la batterie si fort, augmente d’environ 3x au cours de la dernière génération. Ces deux chiffres sont construits sur une paire de noyaux de performance C1-Ultra flanqués de six cœurs d’efficacité C1-Pro.
ARM dit que Kleidiai et SME2 augmenteront les performances des plateformes d’IA existantes. Samsung, MediaTek et Apple sont tous appelés pour améliorer la réactivité et l’efficacité des applications d’IA à disque. Les traductions et résumés automatisés bénéficieront également de la technologie.

Lumex apporte des performances de jeu aux GPU Mali
ARM dit que son nouveau GPU Mali G1-Ultra permettra des graphiques de classe console sur les smartphones. La nouvelle unité de traçage des rayons V2 (RTUV2) augmente les performances de l’éclairage avancé, des ombres et des réflexions par un facteur de deux par rapport à la dernière génération de GPU ARM, surnommée Immortalis G925. Il ne semble pas que les graphiques tracés en temps réel aient pris le contrôle des jeux mobiles comme ils l’ont fait sur les plateformes de bureau et de console, mais cela semble être une question de temps avant que les joueurs mobiles l’exige.
Au-delà du traçage des rayons, ARM dit également que le Mali G1-Ultra fournira une augmentation de 20% des repères graphiques par rapport à la dernière génération. La société appelle spécifiquement Arena Breakout, Fortnite, Genshin Impact et Honkai Starail. De plus, ces titres verront une augmentation des performances et de l’efficacité énergétique sur les dispositifs de sous-flag et axés sur l’efficacité équipés de Mali G1-Premium et G1-Pro GPU également.
ARM dit que les références graphiques avec le nouveau GPU G1-Ultra à 14 cœurs affichent une augmentation des performances de 20% tout en utilisant simultanément 9% moins d’énergie par cadre par rapport à Immortalis G925. L’inférence de l’IA sur le GPU est également augmentée à hauteur de 20%. Tout cela s’ajoute aux performances doublées avec le traçage des rayons.

ARM LUMEX améliore l’IA sur la plate-forme
ARM fait de grandes revendications avec son annonce Lumex. La société affirme que les performances de l’IA augmenteront jusqu’à 5x sur les appareils Lumex par rapport à la dernière génération, y compris 4,7 fois la latence inférieure pour les charges de travail basées sur la parole et la génération d’audio 2,8 fois plus rapide. Ce sont des chiffres assez grands.

Cela reste à voir, cependant, car les appareils tirant parti des nouveaux designs n’ont pas encore été annoncés. Et aux États-Unis, la plupart des appareils Android utilisent des puces conçues par Qualcomm, qui allait de côté avec un bras en cour. Alors que les appareils commencent à arriver sur le marché, vous pouvez compter sur Hothard Pour être juste prêt et capable de faire rapport sur les derniers, alors restez à l’écoute.