据香港IDC新天域互联了解,在群众AI算力竞争日趋热烈的布景下,谷歌云(Google Cloud)在最新一届App Dev & Infrastructure峰会上发布重磅新品——新一代云霄超等盘算处事Hypercomputer登第六代TPU(张量解决器)Trillium,展现了其在AI基础措施限制的宏愿。
算作现在浮点运算性能最强的TPU,Trillium的单一集群可提供高达91 exaflops的算力。与客岁发布的TPU v5e比较,新品在AI模子测验性能上提高了4倍,推理隐约量提高3倍,单芯片峰值盘算性能更是提高了4.7倍。值得刺见识是,在性能大幅提高的同期,其动力破费却减少了67%,体现了谷歌在绿色盘算方面的技巧松懈。
在本体性能测试中,Trillium在初始Gemma 2-27B、MaxText Default-32B和Llama2-70B等大模子时,性能较上一代TPU v5p提高卓绝4倍。从老本效益角度来看,Trillium比v5e跨越1.8倍,比v5p跨越2倍,展现出极具竞争力的性价比。
硬件升级方面,新品在高频内存(HBM)容量和芯片间互连带宽上齐终赫然翻倍提高。通过芯片互连技巧(ICI),单个高带宽低延长Pod最多可推广至256个芯片,并可通过一语气数百个Pod酿成包含上万颗芯片的超等盘算集群。合营谷歌13 Petabit/s的Jupiter数据中心汇集,可终了接近线性的性能推广。
除了新一代TPU,谷歌云还推出了多项配套居品:搭载NVIDIA H200 Tensor Core GPU的A3 Ultra VM预览版将于11月推出,其GPU间汇集带宽和LLM推感性能较前代居品提高1倍;基于自研Arm架构Axion解决器的C4A VM处事也已上线,较传统x86架构VM在性价比和能效方面分袂提高65%和60%。
在汇集措施方面,新上线的Jupiter光纤交换汇集提供400Gb/s的原生一语气速率和13.1Pb/s的对分带宽,据称可解决地球上通盘视频图像。同期推出的AI/ML专用存储处事Hyperdisk ML在数据传输速率上达到了1.2TB/s,超越竞争敌手近100倍。
跟着AI技巧快速发展,算力需求呈指数级增长。这次谷歌全面升级AI基础措施,不仅展现了其在AI芯片限制的技巧实力,更预示着新一轮算力竞争的到来。在英伟达主导的AI芯片商场中开yun体育网,谷歌能否凭借新品掀开阵势,值得商场执续格式。