I processori Intel Gaudi 3 e Xeon 6 arrivano per potenziare l'intelligenza artificiale

Che si tratti o meno di una realtà organica, le aziende tecnologiche hanno deciso unilateralmente che l’intelligenza artificiale generativa è la prossima grande novità, e i fornitori a ogni livello della catena di fornitura stanno investendo miliardi di dollari nello sviluppo di hardware e software di intelligenza artificiale. Ciò ovviamente include Intel, la cui presentazione oggi all’evento Intel Vision 2024 era fortemente incentrata sull’intelligenza artificiale e sull’hardware e il software che può offrire per gestirla.

Intel Vision Enterprise ai
Non siamo sicuri del significato di questa diapositiva, ma sembra tutto molto impressionante.

Siamo concentrati sull'hardware attorno a queste parti (è nel nome, dopotutto), quindi non esamineremo il software in dettaglio, ma l'idea generale alla base dell'approccio software di Intel è che i suoi clienti possono semplicemente acquistare qualunque cosa Intel l'hardware si adatta alle loro esigenze e gli strati intermedi si prenderanno cura di tutto. Ma quale hardware AI offre Intel? Principalmente, acceleratori AI Gaudi e processori Xeon con estensioni del set di istruzioni focalizzate sull'intelligenza artificiale.

progressi di Gaudí

Intel ha presto in arrivo nuovi hardware per entrambe le categorie e li ha annunciati al suo evento Vision. Gaudi 3 è naturalmente il successore dell'acceleratore AI Gaudi 2 e Intel afferma che il prossimo pacchetto da 5 nm offrirà il doppio delle prestazioni FP8, quadruplicare le prestazioni BF16, raddoppiare la larghezza di banda di rete e un aumento del 50% nella larghezza di banda della memoria rispetto a Gaudi 2. .

specifiche gaudi

In termini di specifiche generali, questa parte è ottimizzata sia per la gestione di modelli molto grandi sia per la capacità di scalare fino a proporzioni enormi. Le sue caratteristiche architettoniche e l'ampia cache SRAM da 96 MB gli conferiscono un vantaggio nel lavorare con modelli AI molto grandi, e le ventiquattro connessioni Ethernet da 200 Gigabit integrate di Gaudi 3 gli consentono di scalare, teoricamente, fino a 1024 nodi in un singolo grappolo. Secondo Intel si tratterebbe di circa 8192 chip Gaudi 3, con un throughput teorico di calcolo FP8 da qualche parte nell'intervallo 15 exaflop.

Advertisement

formazione gaudiana

Intel confronta direttamente Gaudi 3 con la GPU Intel Hopper H100 addestrando una varietà di modelli. In tutti i casi esemplificativi, Gaudi 3 presenta un notevole vantaggio in termini di prestazioni. Naturalmente, Intel non ci mostrerà numeri che non facciano sembrare Gaudi 3 nientemeno che fantastico, giusto?

inferenza di Gaudì

Ebbene, secondo le inferenze, Gaudi 3 sembra meno dominante, anche se le prestazioni sono certamente competitive. Si tratta davvero del grande modello Falcon-180B in cui il nuovo componente Intel può sgranchirsi le gambe e scappare dalla GPU NVIDIA, con un miglioramento delle prestazioni fino a 4 volte, anche se dobbiamo sottolineare che questi numeri sono tutte proiezioni.

Advertisement

efficienza di Gaudí

Un grande punto a favore di Gaudi 3 che Intel ha sottolineato alla stampa è la sua relativa efficienza. Nonostante sia costruito su un processo senza nome a 5 nm rispetto all'H100 di Nvidia (che è fabbricato sul 4N di TSMC), Intel afferma che Gaudi 3 può offrire fino a 2,3 volte l'efficienza energetica rispetto al componente NVIDIA. Una parte significativa di questo aumento di efficienza è senza dubbio dovuta alla cache su chip estremamente ampia da 96 MB.

infografica di gaudi

Gaudi 3 arriverà nei formati mezzanine (OAM) e per schede aggiuntive PCIe, nonché in un fattore di forma baseboard universale destinato all'uso in grandi cluster. Intel afferma che gli sviluppatori potrebbero essere in grado di migrare i loro modelli per eseguirli su Gaudi in appena tre righe di codice; Stability AI afferma che ci è voluto “meno di un giorno” per passare all'hardware Intel. Queste parti verranno campionate ai clienti molto presto, mentre la produzione di massa avverrà nella seconda metà dell'anno.

xeon pcore ecore

Ma che dire dei nuovi Xeon di cui abbiamo parlato? Bene, si scopre che Intel sta racchiudendo i suoi Sierra Forest Xeon, dotati di fino a 288 e-core Crestmont, nella stessa famiglia di prodotti con le sue imminenti CPU Granite Rapids. Queste parti sono CPU Xeon più tradizionali, con molti P-core grandi e veloci. Entrambe le famiglie di processori vengono collettivamente chiamate “Xeon 6” da Intel.

efficienza dello xeno

Intel purtroppo condivide pochissimi dettagli su entrambe le famiglie di processori al momento, anche se il produttore di chip ha offerto la diapositiva sopra promettendo una riduzione di potenza annuale di oltre un megawatt nel caso in cui qualcuno sostituisca alcuni vecchi Xeon di seconda generazione con il nuovissimo Sierra Forest. parti. Riteniamo che ci siano alcuni dettagli in più su Sierra Forest perché questi chip dovrebbero essere lanciati da un giorno all'altro, mentre Granite Rapids arriverà “poco dopo”, secondo Intel.

Advertisement