Google、第6世代Cloud TPU「Trillium」発表 - TPU v5e比でピーク4.7倍の性能強化
2024年5月16日(木)14時9分 マイナビニュース
Googleは自社サービスで用いるための推論専用AIチップを独自に開発しており、今回発表されたのはこの第6世代モデル。第5世代モデルの高効率チップ「v5e」比でピークコンピューティングパフォーマンスが4.7倍に達する高い性能を実現したとしており、HBMメモリの容量・帯域幅は2倍に。超大規模エンベディングを処理するための専用アクセラレータの第3世代モデル「SparseCore」が統合され、高度なランキングおよびレコメンデーションワークロードを高速に処理可能だという。
性能向上の一方、効率を重視したTPU v5eよりも最大67%以上エネルギー効率を引き上げた点も特徴。1つの高帯域幅・低遅延のポッド内で最大256個までスケールアップできるほか、Cloud TPUマルチスライスやTitaniumを活用することで数万個まで相互に接続することも可能だという。
第6世代Cloud TPU「Trillium」を搭載したインスタンスは今年後半から利用可能になるようだ。