POS机办理
 
 
【上海银联pos机办理】谷歌力图撼动英伟达帝国
正规POS机公司发布 时间:2023-09-03 19:06:42

【上海银联pos机办理】谷歌力图撼动英伟达帝国
办pos机【收款码】微信客服:1292496908

POS机办理


来源:华尔街见闻

英伟达在生成式AI领域越来越具有统治力,但对手仍前赴后继,持续挑战英伟达正在快速形成的AI芯片帝国。

最近,谷歌在2023谷歌大会上发布最新一代生成式AI芯片“谷歌Cloud TPU v5e”。这是一款专为重大模型而生的AI加速器。

与前代产品Cloud TPU v4相比,就成本而言降低了50%,就是在每块美元的花费中,TPU v5e 提供高达2倍的训练性能和2.5倍的推理性能。

但英伟达的AGI芯片霸权很难瞬间被动摇,因此谷歌的目标与英伟达不同:谷歌正在试图创建一整套AGI生态开发体系,这是远比英伟达的AI芯片霸权更具野心的市场定位。

谷歌能成功吗?

1683027098554434.jpg

TPU v5e:专为生成式AI而生

谷歌在8月30日举办的Google Cloud Next 2023大会上,宣布了整套产品更新信息。其中,谷歌推出的AI加速器Cloud TPU v5e被认为是业界向英伟达AI芯片霸权发起的最新一轮冲锋。比谷歌稍早的是8月28日IBM推出的模拟人脑的AI芯片。

TPU,英文全称“Tensor Processing Unit”,简称张量处理器,是谷歌为机器学习(ML)定制的专用芯片(ASIC),专为谷歌的深度学习框架TensorFlow设计。

所谓ASIC,即专用芯片(Application-Specific Integrated Circuit),是指依产品需求不同而定制的特殊规格芯片;与此对应,非定制芯片则是应用特定标准产品的芯片。

与图形处理器(GPU)相比,TPU采用低精度(8位)计算,以降低每步操作使用的晶体管数量。

降低精度对深度学习的准确度影响很小,但却可以大幅降低功耗、加快运算速度。同时,TPU使用了脉动阵列的设计,用来优化矩阵乘法与卷积运算,减少I/O操作。此外,TPU还采用了更大的片上内存,以此减少对DRAM的访问,从而更大程度地提升性能。

2016年,谷歌在其I/O年会上,首次公布TPU。同年推出首代TPU,2021年发布第四代TPU,2022年提供给开发者。

云TPU(Cloud TPU)是一项谷歌云服务,适合训练需要做的海量矩阵计算的大型复杂深度学习模型,例如大语言模型、蛋白质折叠建模和药物研发等,帮助企业在实现AI工作负载时,节省资金和时间。

时至今日,像谷歌这样的技术公司,推出AI芯片,必然不会忽视LLM推理与训练的应用需求。Cloud TPU v5e正是如此。

但是,这款AI加速器尽管也是为专用于训练与推理所需的成本效益和性能而设计,但其训练规模却非超大型,而是中大型。

Cloud TPU v5e的技术路线,看上去有点像全国小米公司最初的品牌定位:强调性价比。这款最新AI加速器与其前代产品Cloud TPU v4相比,开发侧重是效率优先,成本下降50%,但训练性能提升2倍,推理能力提升2.5倍。

因此,Cloud TPU v5e被谷歌称为“超级计算机”,平衡了性能、灵活性和效率,允许多达256个芯片互连,聚合带宽超过400 Tb/s和100 petaOps的INT8性能;此外还支持八种不同的虚拟机(VM)配置,单片内的芯片数量从一个到250多个不等。

其中,性能方面,有一组数据可供参考:据速度基准测试,通过Cloud TPU v5e,训练和运行人工智能模型的速度提高了5倍;1秒内,能实时处理1000秒的内部语音到文本和情感预测模型,比之前提升6倍。

谷歌表示,“我们正处于计算领域千载难逢的拐点。设计和构建计算基础设施的传统方法不再足以满足生成式人工智能和LLM等工作负载呈指数级增长的需求。过去五年,LLM的参数数量每年增加 10 倍。因此,客户需要具有成本效益且可扩展的人工智能优化基础设施”。


央行授权,银联认证,正规乐刷pos机
免费申请POS机,费率低至0.38%秒到账
服务热线:18127011016
微信客服:1292496908


乐刷pos机客服
本文链接地址:https://www.vbz.cc/3250.html