IBM推出全球首个7nm训练推理节能芯片
在AI核算机练习与推理范畴,存在着这样一种理念:假如核算需求很大,那么为其提供动力所需的能量也将很大。这种理念也被该范畴广泛接受。那么有没有或许开宣布一种既能够明显提高核算才能又无需耗费过多能量的方法呢?IBM在顶会ISSCC上介绍了一种7nm练习推理节能芯片。
自动驾驶轿车、文本转语音和送货无人机,这些都是人工智能的典型使用。为了不断推进?AI 淘金热,人们一直致力于改善 AI 硬件技能的核心,即赋能深度学习的数字?AI 内核,它是人工智能的要害推进力。
在该范畴的深化探究中,IBM Research 经过资料、设备、芯片架构和整体软件堆栈方面的创新,在适应 AI 系统的负载复杂性以及简化和加速功能方面取得了长足进步,然后推进具有尖端功能和无可比拟能效的下一代 AI 核算机系统的开发。
近来,在?2021 年国际固态电路虚拟会议(ISSCC)上发表的一篇新论文《A 7nm 4-Core AI Chip with 25.6TFLOPS Hybrid FP8 Training, 102.4TOPS INT4 Inference and Workload-Aware Throttling》中,IBM 团队详细介绍了全球首个采用 7nm 技能进行低精度练习与揣度的节能 AI 芯片。经过其新颖的设计,该 AI 硬件加速器芯片支撑多种模型类型,同时在所有模型类型上均实现了抢先的能效。
IBM 表明,经过令练习更靠近边际以及使数据更靠近来源,这一芯片技能能够扩展并用于多种商业使用,从云上的大规模模型练习到安全隐私服务。此外,这种高效节能的 AI 硬件加速器能够明显提高核算才能,包含混合云环境中的核算才能,而且无需大量的动力。
AI 模型的复杂性和适应性正在敏捷扩展,现已用于药物发现、留传 IT 使用的现代化以及为新使用编写代码等。可是,AI 模型复杂性的快速演化也添加了该技能的能耗,而且面对的一个首要问题是怎么创立复杂的 AI 模型而不添加碳排放量。从历史上看,该范畴现已接受了这样一种理念,即假如核算需求很大,那么为其提供动力所需的动力也将很大。
IBM 想要改变这种理念,开宣布一种既能够明显提高核算才能又无需耗费过多能量的全新节能 AI 硬件加速器。
一、怎么实现
这篇?ISSCC 论文聚集怎么创立针对所有不同 AI 模型类型的低精度练习与揣度进行高度优化的芯片,且该芯片在使用层面上对质量不形成危害。
IBM 展现了该新芯片的多种新特性:
IBM 表明这是首个集成了超低精度混合 FP8 (HFP8) 形式的硅芯片,能够 SOTA 硅技能节点(7 nm EUV-based 芯片)练习深度学习模型。在所有不同精度条件下,其原始能效是最优的。下图 2 展现了 IBM 芯片功能与能效超过其他专用的揣度和练习芯片。
从上图中,咱们能够看到?IBM 将该 7nm 芯片与多款芯片做了对比,包含阿里巴巴 12nm 的芯片以及英伟达的 A100。
但这并不是全部。它仍是将电源办理整合到?AI 硬件加速器中的第一批芯片之一。该研讨表明,经过怠慢高功耗核算阶段的速度,能够在芯片的总功耗预算内最大化其功能。
最终,芯片除具有出色的峰值功能外,还具有可转化为实践使用功能的高继续利用率,这也是该芯片提高能效的要害部分。作者称,与远低于?30%的典型 GPU 利用率相比,该芯片可实现 80%以上的练习利用率和 60%以上的揣度利用率。
二、使用远景广泛
IBM 研讨员表明,这一新的 AI 核与芯片可用于多种跨职业的云与边际使用。例如,相对于当时职业中使用的 16 位(bit)和 32 位格式,该芯片可用于 8 位视觉、语音和自然语言处理的大规模深度学习模型云练习。它们还可用于语音到文本 AI 服务、文本到语音 AI 服务、NLP 服务、金融交易诈骗检测等云揣度使用程序。
自动驾驶轿车、安全摄像头和移动电话也能够从中受益,该芯片能够方便地在边际设备上进行联邦学习,以实现定制化,保护客户的隐私、安全性和合规性。
作者希望经过这项作业建立一种全新的方法,来创立和布置可扩展功能并下降功耗的?AI 模型。更多技术动态关注浙江安防资质网!