在“2019 阿里云峰会”上,阿里平头哥正式发布了当时业界最强的高性能RISC-V处理器内核——玄铁C910,引发了业界的广泛关注。实际上,早在2014年之时,平头哥副总裁孟建熠就已经开始关注RISC-V,2018年,平头哥成功研发一款低功耗的RISC-V内核玄铁E902。此后,平头哥持续深耕RISC-V领域,并迅速成为了RISC-V领域的领导厂商。
11月3日,在杭州举行的“2022云栖大会”上,平头哥发布全新的RISC-V高能效处理器——玄铁C908。据介绍,玄铁C908计算能效全球领先,较业界同性能处理器的能效提升了超20%。
△阿里云智能总裁张建锋介绍RISC-V最新进展
至此,平头哥已经累计正式推出了三个系列八款RISC-V CPU内核,覆盖了低功耗的安全需求、高性能、成本优化、计算增强、高能效等不同类型的用户需求。与此同时,作为RISC-V领域的头部厂商,平头哥还在不断通过与龙蜥社区、统信软件、谷歌安卓合作,持续拓展RISC-V软件生态,探索RISC-V在云端、桌面端和移动端的潜力,全面助力RISC-V产业的发展。
开源RISC-V是中国芯片产业大机遇
目前在CPU市场,英特尔的x86架构及Arm架构仍然是全球最为主流的指令集架构。其中,x86架构统治着PC及服务器市场,而Arm架构则几乎完全垄断了移动市场。近年来兴起的RISC-V架构,得益于其指令精简、模块化、可扩展、开源的优势,也迅速在对功耗、成本更为敏感的物联网市场站稳脚跟,并开始持续向着更高能效和高性能的市场进行开拓,大有与x86、Arm三足鼎立之势。
根据Semico Research的最新预测,到2025年,全球RISC-V CPU内核的出货量累计将达到约800亿颗(去年之时这一预测还是624亿颗),年复合年增长率高达114.9%,在全球CPU内核出货量当中的占比将超过14%。
Counterpoint Research的数据则显示,到2025年,RISC-V在IoT市场的市占率将达28%,在工业市场的市占率将达12%,在汽车市场的市占率将达10%。
“RISC-V是有史以来最丰富、最开放的指令集架构,同时RISC-V也正在迅速构建最强大的生态系统。目前,基于RISC-V内核的芯片出货量已经达到了100亿颗。德勤预测2022年RISC-V内核芯片出货量将比2021年翻一番,2023年将再翻一番。RISC-V的崛起已是大势所趋。”在2022云栖大会上,RISC-V International首席执行官Calista Redmond通过视频演讲时说到。
而RISC-V产业迅猛发展的背后,也得益于中国厂商的热捧。近年来,国内对于核心芯片的自主可控需求越来越高,开源的RISC-V自然也备受国内厂商的追捧。
中国工程院院士倪光南在2022云栖大会上表示:“开源模式已从软件领域走向硬件领域。RISC-V降低了进入芯片行业的门槛,也符合未来万物智能时代的技术发展趋势,中国要争取在万物互联的新时代,使得RISC-V发展成为世界主流CPU架构,形成x86、Arm和RISC-V三分天下的格局。”
这与中国科学院院士褚君浩的想法不谋而合,在2022云栖大会上,他表示:“当前开源开放已经成为信息技术系统的一大趋势,成为全球协同创新的新模式,持续推动信息技术的快速发展。芯片的基础是指令集,开源、精简的RISC-V指令架构,为我们国家掌握芯片产业的发展主动权也提供了机遇。”
值得注意的是,在RISC-V基金会的3100多家会员当中,中国企业占比达到了近一半。即便是在RISC-V基金会目前的24家最高级别的董事会成员当中,中国厂商的占比也接近了一半,其中就包括阿里平头哥。而作为董事会成员单位,可以提名一名理事委员会理事,以及技术委员会代表,可直接影响RISC-V标准的制定和技术发展方向。
目前阿里平头哥是RISC-V国际基金会董事会成员,并且在基金会中的数据中心、存储管理、安卓、安全等11个技术组织当中担任主席、副主席的职位,重要性及数量居世界前列、中国机构首位。在RISC-V国际舞台上,平头哥正推进RISC-V国际标准制定,推动全球RISC-V技术与生态发展。
玄铁C908:能效较同性能处理器高出20%
此前,RISC-V最显著的标签是低功耗,平头哥在2019年推出最高主频达2.5GHz的玄铁C910,突破了业界对RISC-V的性能想象。
如今,平头哥又将目光瞄向了智慧视觉、智能交互和多媒体终端这三大非常重要的高性能应用领域。在满足高性能需求后,它们对RISC-V提出了高能效的挑战。
于是,极致高能效的RISC-V处理器玄铁C908便应运而生。
△平头哥副总裁孟建熠发布玄铁C908
根据官方公布的数据显示,玄铁C908计算能效全球领先,较业界同性能处理器的能效提升了超过20%,可以帮助客户大幅降低单位性能的成本。那么玄铁C908是如何实现如此高的能效的呢?
孟建熠介绍,玄铁C908依然是高性能的。它是兼容RISC-V基金会刚刚制定的RVA22标准,最多支持16个核,主频最高可以到2GHz,并且第一次实现了RISC-V Vector1.0的架构,AI热点运算相比玄铁C906提升了1.5倍以上。此外,玄铁C908还加入了XIE指令扩展,支持特定行业应用的性能提升。
性能提升之外,玄铁C908的能效也进一步提升,比玄铁C906提升了24%。具体来说,玄铁C908主要是从CPU能效和AI能效两个核心方向入手,实现了RISC-V架构的能效突破。
具体来说,玄铁C908主要是从CPU能效和AI能效两个核心方向入手,实现了RISC-V架构的能效突破。
玄铁C908支持多核多簇架构,通过双路访存架构(访存带宽提升了31-41%)、多级cache扩展、多模式混合分支预测等技术,实现CPU通用性能的大幅提升:相比上一代的玄铁C906,新推出的C908在整型计算、嵌入式整数、单精度浮点、浮点计算等方面性能平均提升了40%以上。
为进一步提升AI算力及能效,玄铁C908升级了微架构,首次采用RISC-V Vector 1.0标准,并基于标准新增DOT指令;推出INT4数据类型;全面优化AI算子及算法库,典型神经网络计算的性能比前一代的C906提升了50%以上;在图像分类任务中性能相比C906更是大幅提升了3.5倍。
要知道,在今年4月公布MLPerf Tiny V0.7榜单上,玄铁C906处理器的软硬件联合优化方案,取得了全部4个指标的第一的成绩,并且达到了其他竞品同类最优性能的10倍以上,成为了当时最高能效比的AIoT计算内核。而此次发布的玄铁C908在MLPerf Tiny V0.7推理性能测试成绩上,相比C906又进一步提升了2~3倍,这也足见玄铁C908的AI能效提升之大!
孟建熠表示,玄铁C908完全可以覆盖1T以下的AI算力需求,而不需额外的NPU。
在目前火热的计算视觉处理方面,得益于玄铁C908在Intrinsic编程、软硬融合优化、向量位宽自适应等方面的改进,配合平头哥提供的优化好的OpenCV库(有128位和256位两种),相比于同类的竞品分别提升了1.5倍和2.25倍。
此外,平头哥还推出了具有高弹性(支持不同操作系统)、可扩展(支持大量可拓展组件)、高能效特性的跨平台视频视觉的应用框架TMedia,进一步提升AI效率。
在论坛上,孟建熠还透露,在此次玄铁C908发布之时,已经有了很多客户,帮助平头哥完成了第一轮的产品化。其中,嘉楠科技采用玄铁C908研发的中高端立体视觉AI芯片K230,即将于2023年上半年面世,这款芯片将用于智能家居、辅助驾驶、机器人感知和智能教育等领域。
“玄铁C908打开了RISC-V高能效应用的一片蓝海领域,我们希望更多伙伴和我们一道,关注能效创新,一起推动RISC-V继续向高性能、高能效演进。”孟建熠说到。
“玄铁C908打开了RISC-V高能效应用的一片蓝海领域。我们希望通过这个处理器的发布,能够让整个生态更加关注能效的创新,一起推动整个RISC-V在高性能、高能效这方面的优势。”孟建熠说到。
从端到云,玄铁RISC-V生态大跨步
目前在PC及服务器CPU市场,x86架构占据着近90%的市场份额,这主要因为多年来x86处理器与Windows系统之间的生态的捆绑;在移动CPU市场,则几乎完全由Arm架构统治,也得益于过去十多年来Arm处理器与Android系统之间的生态捆绑。
相比之下,目前在物联网市场并没有类似的垄断性的生态霸主。而RISC-V架构所具备的指令精简、模块化、可扩展、开源等特性,所带来的低功耗、低成本、高能效、高可扩展性等优势,与很多物联网应用天然契合,这也正是RISC-V迅速在物联网市场获得成功的关键。
RISC-V是一个面向未来的非常年轻的新架构,其内部采用的是模块化、可扩展的设计,这也就意味着,只要增加很多相应的模块,就能够扩展到移动、桌面、数据中心市场,并且在AI等很多方面,相对于以往的指令集架构RISC-V也更具天然优势。
孟建熠向芯智讯解释称:“传统的高能效内核,更多是从硬件出发作AI探索,效果有限。RISC-V是先有了AI算法的理解,再来做处理器,比如玄铁C908,在设计硬件之初,就率先引入了RISC-V Vector 1.0,带来了AI能效数倍的提升。”
当然,RISC-V要进入移动、桌面、云端等市场,更为关键的还是要补足软硬件生态。
在2021年的云栖大会上,平头哥主动打破固有的行业商业模式,将旗下玄铁E902、E906、C906、C910等4款量产处理器IP,以及基于玄铁的多操作系统的全栈软件及工具进行了开源,希望降低RISC-V创新应用成本,吸引更多的人加入RISC-V生态,加速RISC-V生态的完善。
在软件生态方面,平头哥在实现对于AliOS、FreeRTOS、RT-Thread、Yocto Linux支持的同时,目前也与相关合作伙伴一起推动对于Android、龙蜥Anolis OS、统信deepin等国际主流和国产操作系统的深度适配。
在今年8月的2022 RISC-V 中国峰会上,平头哥完成了 RISC-V 与面向云端服务器的龙蜥操作系统的适配,首次运行 FireFox 浏览器、LibreOffice 等大型桌面级软件,以及 Hexo 和 Open Rocket 等基于 NodeJS 和 JAVA 的应用,极大拓展了 RISC-V 的想象力。
今年9月,平头哥、龙蜥社区、RISC-V国际基金会、中科院PLCT,与统信软件展开合作,成功地在平头哥SoC原型曳影1520上启动了deepin 操作系统,流畅运行桌面、办公、影音及开发等关键大型软件,将RISC-V推向桌面端。据统信软件桌面操作系统产品线总经理王耀华介绍,预计到deepin V23正式发布的时候,RISC-V将可以作为一个官方正式支持的架构存在。
在移动端方面,今年10月,由阿里巴巴平头哥贡献的RISC-V移植安卓的代码补丁集合,被安卓AOSP社区收录进系统源代码,成为全球首批RISC-V兼容安卓的正式补丁,这意味着谷歌安卓开启了对RISC-V架构的官方原生支持。
至此,RISC-V成功实现了从端到云的软件生态的初步打通,实现了生态扩展的一个大的“跨步”。
这虽然是行业里的一个大跨步,但在孟建熠看来,还远远不够:“处理器的软件生态是很厚的,我认为到今天为止,底层部分的第三方软硬件生态已经支持RISC-V了,但是,中间件、应用部分走得还是相对比较慢。”
面向未来,平头哥仍是勇字当前,继续去做RISC-V领域没人做到的事情。
“从低功耗,到高性能,再到高能效,平头哥大幅提升软硬一体的全栈能力,打造出丰富的玄铁RISC-V处理器家族。我们还将不断拓展RISC-V技术、应用和生态的边界,挖掘RISC-V在更广阔的端云一体生态中的新价值。”孟建熠总结说道。
作者:芯智讯-浪客剑