8月23日,IBM研究实验室在《自然》期刊杂志上公布了其最新研究成果,研发出了一种全新的人工智能(AI)模拟芯片,能效可达传统数字计算机芯片的14倍,可大幅降低AI计算的功耗。
该文章摘要显示,当前拥有数十亿个参数的 AI 模型可在一系列任务中实现较高精度,但也凸显出传统通用处理器(包含图形处理器、中央处理器等)效能低下的问题。对此,IBM研究团队提出“模拟内存计算”的方案,通过在自身的存储器上并行执行矩阵-向量乘法,以提供更强的能效。
IBM的研究团队基于该方案开发出了一个 14nm 模拟芯片,利用34个大型相变存储器(PCM)阵列,结合了数模转换输入、模拟外围电路、模数转换输出和大规模并行二维网格路由。每个14nm芯片上可编码3500万个PCM,在每权重对应2-PCMs的方案中,可容纳1700万个参数。将这些芯片组合在一起,便能够像数字芯片一样有效地处理真实AI用例的实验。
在测试环节中,IBM研究团队先后使用谷歌语音检测和Librispeech语音识别数据集来分别测试该芯片语言处理能力的效率。
在关键词语音检测方面,IBM团队提出了一种卷积神经网络架构,并在包含12个关键字的谷歌语音命令数据集上进行训练。团队采用了架构更简单的FC(全连接)网络结构,最终达到了86.14%的识别精度,且提交速度比MLPerf目前最佳情况快7倍。该模型使用硬件感知训练在GPU上进行训练,然后部署在团队的模拟AI芯片上。
在规模更大的 Librispeech 语音识别数据集上,利用5个模拟AI芯片组合在一起,运行RNN-T(循环神经网络转换器)模型,以逐个字母地转录语音内容。该系统包含5个芯片上1.4亿个PCM设备的4500万个权重,能够采集人们说话的音频并以非常接近数字硬件设置的精度进行转录。该实验最终达到9.258%的单词错误率,能量效率达6.704TOPS/W(万亿次操作每秒/瓦),比MLPerf目前最佳能效提高了14倍。
值得注意的是,IBM的这款AI芯片所搭载的相变存储器,是由IBM与旺宏共同开发的。
据了解,旺宏与IBM合作渊源深厚,早在2004年,双方就已经有策略合作联盟关系,并共同投入相变存储器开发十余年,虽然初期还有不少同业者加入,但随着时间流逝,不少厂商已经退出了共同研发合作,目前旺宏是IBM相变存储器唯一合作伙伴,并取得特定AI相关授权。
目前旺宏与IBM的相变存储器共同开发计划,以三年为一期,期满后双方视状况再签订新共同开发合约。双方早已嗅到AI带来的商机无穷,将相变存储器合作方向瞄准AI应用,最近一次合约于2021年10月签订,旺宏还特别通过重大信息公布了相关内容。
旺宏当时公告指出,该公司将继续参与IBM相变存储器共同开发计划,并取得特定模拟AI技术授权,该次合约从2022年元月22日起至2025年元月21日止,旺宏将有保密义务并分担研发费用,同时遵守美国出口管制法令等义务,具体目的为持续投入先进技术开发,对旺宏技术及竞争力有正面影响。
业界人士分析,相变存储器具备速度快、非挥发性、低功率等特性,让高密度存储器可做为储存应用,填补AI服务器所需的DRAM、NAND当中的价格及性能落差。
对于与IBM合作相变存储器的最新进展,旺宏于29日表示,持续顺利进行中,锁定AI等先进应用发展。
编辑:芯智讯-林子