Google, 차세대 AI 모델을 지원하도록 설계된 괴물 처리 장치 공개

Google은 최근 I/O 이벤트에서 Trillium이라고 불리는 여섯 번째 텐서 처리 장치(TPU)를 발표했으며, 회사에 따르면 새로운 프로세서는 강력한 차세대 AI 모델을 위해 설계되었습니다.

이 회사는 처음에 기계 학습 워크로드를 활용하는 Gmail, Google 지도, YouTube 등 자체 내부 제품용 TPU를 만들었습니다. 이제 Google은 이 기술의 6세대를 개발했으며 회사에 따르면 Trillium은 TPU v5e 설계에 비해 최대 컴퓨팅 성능이 4.7배 증가하고 고대역폭 메모리 용량이 2배 증가한 성능을 제공할 예정입니다.

Advertisement

보다 구체적으로, 최고 컴퓨팅 성능이 4.7배 증가했다는 Google의 주장은 새로운 TPU가 BF16에서 926teraFLOPS, INT8에서 1,847teraFLOPS를 처리할 수 있다는 것을 의미합니다. 이는 Google이 6개월 전에 발표한 TPU v5p 가속기보다 약 2배 빠른 속도입니다. . Google은 어떻게 이것을 했습니까? 회사 측은 성능 향상의 원인이 TPU의 MXU(매트릭스 다중 장치) 크기를 늘리고 클럭 속도를 높이기로 한 결정이라고 밝혔습니다.

또한 새로운 TPU에는 3.2Tbps에 도달할 수 있는 칩 간 상호 연결과 함께 1.6TB/s로 작동하는 32GB의 HBM이 있을 것으로 예상됩니다.