热门文章

在AI算力战场从训练全面转向推理之际,谷歌正准备打出关键一击。公司计划在本周于拉斯维加斯举行的Google Cloud Next大会上,宣布其新一代定制化AI芯片,张量处理单元(TPU)。这一信号释放的背景是,全球AI算力竞争正在发生结构性转移,从以模型训练为核心,转向以大规模推理为主导。
随着AI应用软件与AI智能体(AI Agent)采用规模激增,衡量算力的标准正从峰值性能,转向单位token成本、延迟与能效。而这恰恰是以TPU为代表的AI ASIC路线最具优势的领域。谷歌正试图以自研TPU体系,对当前占据AI芯片市场约80%至90%份额的英伟达发起正面挑战。短短几个月内,谷歌独家研发并在谷歌数据中心大规模配置的TPU AI芯片已成为全球科技行业最炙手可热的商品之一。
包括这家科技公司的一些最大规模竞争对手在内的领先人工智能技术开发商们,正纷纷囤积这些芯片。紧随AI推理时代全面到来,在云端AI推理算力需求激增以及聚焦将AI大模型嵌入企业经营的AI微训练趋势之下,性价比更高的谷歌独家TPU AI算力系统对于英伟达近乎90%市场份额的AI芯片垄断地位发起强有力冲击。
席卷全球的生成式AI与AI智能体布局热潮加快了云计算与芯片巨头们的AI芯片开发进程,它们正争相为先进的大型AI数据中心设计速度最快且能效最为强劲的AI算力基础设施集群。
英伟达AI GPU几乎垄断的AI训练侧需要更加强大的AI算力集群通用性以及整个算力体系的快速迭代能力,而AI推理侧则在前沿AI技术规模化落地后更看重单位token成本、延迟与能效。
行情解读:
谷歌长期酝酿的芯片努力在去年10月获得了史无前例的关注度,当时Anthropic PBC宣布扩大算力供给协议,获得最多100万个谷歌TPU的使用权。次月,谷歌推出了更加先进的Gemini 3模型,并且宣布该模型在一部分TPU算力平台上完成训练和运行,并收获如潮好评。













