Google svela un'unità di elaborazione mostruosa progettata per alimentare i modelli IA di nuova generazione

Google ha recentemente annunciato al suo evento I/O la sua sesta unità di elaborazione tensore (TPU) chiamata Trillium e, secondo la società, il nuovo processore è progettato per potenti modelli IA di prossima generazione.

Inizialmente l'azienda ha creato le TPU per i propri prodotti interni come Gmail, Google Maps e YouTube, che sfruttano i carichi di lavoro di apprendimento automatico. Ora, Google ha creato sei generazioni di questa tecnologia e, secondo la società, Trillium arriverà con un aumento di 4,7 volte delle prestazioni di calcolo di picco, insieme al doppio della capacità di memoria a larghezza di banda elevata, rispetto al suo design TPU v5e.

Più specificamente, l'affermazione di Google di un aumento di 4,7 volte delle prestazioni di calcolo di picco significa che il nuovo TPU è in grado di spingere 926 teraFLOPS a BF16 e 1.847 teraFLOPS a INT8, rendendolo circa due volte più veloce degli acceleratori TPU v5p che Google ha annunciato meno di sei mesi fa. . Come ha fatto Google a farlo? La società ha affermato che l'aumento delle prestazioni può essere ricondotto alla decisione di aumentare le dimensioni delle unità multiple a matrice TPU (MXU) e all'aumento della velocità di clock.

Inoltre, si prevede che il nuovo TPU avrà 32 GB di HBM operanti a 1,6 TB/s, insieme a un’interconnessione chip-to-chip che può raggiungere 3,2 Tbps.

Advertisement

Advertisement