Google przedstawia potworną jednostkę przetwarzającą zaprojektowaną do zasilania modeli sztucznej inteligencji nowej generacji

Firma Google ogłosiła niedawno na swoim wydarzeniu I/O szóstą jednostkę przetwarzającą tensor (TPU) o nazwie Trillium. Według firmy nowy procesor jest przeznaczony dla wydajnych modeli sztucznej inteligencji nowej generacji.

Firma początkowo stworzyła TPU dla swoich własnych produktów wewnętrznych, takich jak Gmail, Mapy Google i YouTube, które wykorzystują obciążenia związane z uczeniem maszynowym. Obecnie Google stworzył sześć generacji tej technologii i według firmy Trillium zapewni 4,7-krotny wzrost szczytowej wydajności obliczeniowej oraz dwukrotnie większą pojemność pamięci o dużej przepustowości w porównaniu z konstrukcją TPU v5e.

Mówiąc dokładniej, twierdzenie Google o 4,7-krotnym wzroście szczytowej wydajności obliczeniowej oznacza, że nowy TPU jest w stanie osiągnąć 926 teraflopów na BF16 i 1847 teraflopsów na INT8, co czyni go około dwukrotnie szybszym niż akceleratory TPU v5p, które Google ogłosił niecałe sześć miesięcy temu . Jak Google to zrobił? Firma twierdzi, że wzrost wydajności można powiązać z decyzją o zwiększeniu rozmiaru wielokrotnych jednostek matrycowych (MXU) TPU i zwiększeniu szybkości zegara.

Co więcej, oczekuje się, że nowy TPU będzie miał 32 GB pamięci HBM działającej z szybkością 1,6 TB/s, a także połączenie międzyukładowe typu chip-chip, które może osiągnąć prędkość 3,2 Tb/s.