Sony explique comment il a modifié le GPU de la PS5 Pro pour permettre la mise à l'échelle de l'IA du réseau neuronal PSSR

TL;DR : L'analyse technique de 37 minutes de Sony sur la PlayStation 5 Pro, dirigée par Mark Cerny, détaille les avancées de la console, notamment le réseau neuronal PlayStation Spectral Resolution (PSSR). La PS5 Pro présente une refonte personnalisée du GPU avec des processeurs de groupe de travail accrus et des registres vectoriels améliorés, permettant une mise à l'échelle basée sur l'IA sans matériel supplémentaire spécifique à l'IA.

Vous êtes-vous déjà demandé comment fonctionne la PlayStation 5 Pro ? Sony nous donne une analyse technique détaillée de 37 minutes sur tout ce que vous voudriez savoir sur la nouvelle mise à niveau de milieu de génération.

VOIR LA GALERIE – 7 IMAGES

Sony vient de publier un nouvelle vidéo PS5 Pro spécifiquement pour les passionnés. Le « séminaire technique » de 37 minutes est animé par l'architecte de console Mark Cerny, qui dissipe la magie de la nouvelle console à 700 $ de Sony.

L’un des développements les plus fascinants a été les efforts déployés par Sony pour activer son réseau neuronal exclusif PlayStation Spectral Resolution (PSSR). PSSR est l'analogue propriétaire de Sony, prêt pour console, au DLSS, FSR ou XeSS. Il s'agit d'une solution de mise à l'échelle basée sur l'IA qui utilise un Réseau neuronal d'unité récurrente (RNN)mais pour activer le PSSR, Sony a d'abord dû créer ce qu'il appelle un « réseau entièrement fusionné ».

Inarticle Horizontal

D'accord, voyons de quoi il s'agit avant de continuer. Un réseau entièrement fusionné signifie essentiellement que tout ce qui concerne les CNN – ou les réseaux de neurones convolutifs ou la série de calculs et de processus nécessaires à la mise à l'échelle d'une image sans nuire à la qualité de l'image – est géré sur la puce puis renvoyé dans la mémoire système, et cela l'ensemble du flux de pipeline utilise mieux ou au mieux sa bande passante pour garantir une réduction des déchets.

Cerny explique comment Sony a dû s'attaquer à la solution GPU avant de pouvoir activer le PSSR, mais cela a nécessité une refonte personnalisée du GPU spécifiquement pour la PS5 Pro.

Inarticle Horizontal
Sony explique comment il a modifié le GPU de la PS5 Pro pour permettre la mise à l'échelle de l'IA du réseau neuronal PSSR 13

« Ce que nous voulons vraiment, c'est un réseau entièrement fusionné. C'est le Saint Graal de la mise en œuvre d'un réseau neuronal.

« Avec un réseau entièrement fusionné, vous lisez l'image d'entrée d'un jeu dès le début, traitez toutes les couches du CNN en interne sur la puce, puis réécrivez les résultats dans la mémoire système à la toute fin.

« Il y a cependant deux problèmes que nous devons résoudre. Le premier concerne la quantité de mémoire sur puce requise.

« Il y a 8 millions de pixels dans une image 4K. Si chaque pixel nécessite 16 octets, cela représente environ 128 Mo. En termes de mémoire sur puce, c'est beaucoup. Heureusement, nous n'avons pas besoin de traiter toute la scène en même temps. Nous pouvons subdivisez cet écran et n'en prenez qu'un morceau à la fois via le réseau neuronal.

Inarticle Horizontal

« La difficulté vient du fait que lorsque nous traitons une tuile, de mauvaises données provenant des bords s'infiltrent. Nous devons donc rejeter une partie de nos résultats. Plus la tuile est petite, plus la proportion de données à supprimer est élevée. Il y a Il existe des limites efficaces à la taille de la tuile. Et en conséquence, il existe une certaine quantité de mémoire rapide sur puce qui est essentielle si nous voulons atteindre cet objectif d'un réseau entièrement fusionné.

« L'autre problème que nous devons résoudre concerne la bande passante de cette mémoire sur puce. Nos objectifs sont incroyablement élevés, nous aimerions plusieurs téraoctets par seconde. Quand on pense en ces termes, tout semble petit.

Inarticle Horizontal

« Par exemple, nous pourrions augmenter la taille du cache L2 du GPU et essayer de l'utiliser pour la mémoire sur puce, mais malheureusement, la bande passante L2 n'est que de quelques téraoctets par seconde.

« Ce problème de mémoire a été le point de départ de notre conception personnalisée. À partir de là, cela a pris près de quatre ans. »

Sony explique comment il a modifié le GPU de la PS5 Pro pour permettre la mise à l'échelle de l'IA du réseau neuronal PSSR 3

Lire aussi : GPU PS5 Pro expliqué par l'architecte Mark Cerny : processeur graphique hybride personnalisé avec technologie RDNA multigénérationnelle

Pour résoudre le problème de mémoire, Sony a modifié et amélioré le GPU de la PlayStation 5 Pro, augmentant ses processeurs de groupe de travail (WGP) de 67 % par rapport à la PS5 de base, passant de 18 à 30 WGP.

Inarticle Horizontal

L'architecte PS5 Pro confirme également que Sony utilise les registres vectoriels WGP comme mémoire système, évitant ainsi tout besoin de matériel supplémentaire personnalisé spécifique à l'IA/ML.

Sony explique comment il a modifié le GPU de la PS5 Pro pour permettre la mise à l'échelle de l'IA du réseau neuronal PSSR 10

« Ce que nous faisons sur PS5 Pro, c'est utiliser les registres vectoriels des processeurs du groupe de travail comme RAM.

« Chaque WGP dispose de quatre ensembles de registres, chacun d'une taille de 128 Ko et dépassant un téraoctet par seconde. 30 WGP nous donnent donc 15 Mo de mémoire et une bande passante combinée de 200 téraoctets par seconde, soit plusieurs centaines de fois plus rapide que le système. mémoire.

« Bien sûr, l'architecture et le jeu d'instructions RDNA de la feuille de route ont nécessité quelques modifications pour mieux tirer parti de cette RAM enregistrée.

Inarticle Horizontal

« Nous avons fini par ajouter 44 nouvelles instructions Shader, ces instructions adoptent cette approche plus libre pour enregistrer l'accès à la RAM et implémentent également les mathématiques nécessaires pour les CNN, qui sont principalement effectuées avec une précision de 8 bits.

« Ces instructions sont spécifiquement conçues pour fonctionner en mode de reprise dans lequel chaque WGP traite le CNN pour une seule tuile d'écran. »

Sony a choisi de booster le GPU de la PS5 Pro au lieu d'opter pour un NPU dédié, car les NPU ne sont pas aussi performants en matière de pré- et post-traitement requis pour le streaming de contenu de jeu.

Sony a choisi de booster le GPU de la PS5 Pro au lieu d'opter pour un NPU dédié, car les NPU ne sont pas aussi performants en matière de pré- et post-traitement requis pour le streaming de contenu de jeu.

Inarticle Horizontal

Mark Cerny a également réitéré comment Sony a modifié le GPU de la PS5 Pro de manière récente interview avec IGN:

Quant à l'upscaler IA que vous utilisez pour PSSR, s'agit-il d'un élément matériel discret ou est-il intégré au GPU lui-même ?

Nous avions besoin d’un matériel doté de très hautes performances pour l’apprentissage automatique. Nous sommes donc allés modifier le noyau du shader pour que cela se produise.

Plus précisément, en ce qui concerne ce que vous touchez du côté logiciel, il existe 44 nouvelles instructions d'apprentissage automatique qui adoptent une approche plus libre pour enregistrer l'accès à la RAM. En fait, vous utilisez la RAM du registre comme RAM et implémentez également les mathématiques nécessaires pour les CNN.

Inarticle Horizontal

Pour dire les choses différemment, nous avons amélioré le GPU. Mais nous n’y avons pas ajouté d’unité tensorielle ou quelque chose du genre.

Inarticle Horizontal