8月3日,芯动科技“风华2号”GPU新品发布会暨前沿技术应用研讨会,在武汉光谷皇冠假日酒店隆重举办。正如去年底“风华1号”发布会上宣布的,高性能国产桌面级GPU芯片“风华2号”如期而至,通过基准测试跑分、办公软件、工程制图、GIS到游戏娱乐等多种重度典型应用的现场实时演示,向业界全方位揭开了这款集超高能效比、众多创新技术于一身的桌面级GPU芯片的神秘面纱,性能领跑国产桌面、笔记本电脑和工控机赛道,效果震撼全场。
▲芯动科技CEO敖海展示了采用“风华2号”GPU芯片的无风扇板卡(3-5W工作功耗下)
揭秘“风华2号”
实现多个创新突破
在新品发布环节,芯动科技总裁敖海表示,让风华GPU走进千家万户,赋能未来多彩生活,改变国产GPU商用无芯的历史,是芯动GPU团队的使命担当。使命必达,是芯动人的一贯作风。“风华2号”是一款集超低功耗、强渲染、4K高清三屏显示、4K视频解码及智能AI计算于一体的桌面和笔记本GPU,实现了多个自研技术的创新突破。
▲风华2号支持三屏高清显示(演示场景为CAD制图、高清视频、曼哈顿)
首先,“风华2号”实测能效比领先,在统信4K桌面环境,风华2号运行在低功耗模式下,芯动工程师现场演示了金山WPS、视频网站、中望CAD、glmark等各种典型桌面渲染应用,操作流畅;即使同时开启多种应用的实测,工作功耗仅在4瓦左右,其能效比远优于市场同等算力产品。这样低功耗的独立显卡GPU,在全球市场都是罕见的,低散热要求使得系统可靠性大大增加,可以支持无风扇设计,支持笔记本和MXM一体机。
▲风华2号在Unigine Heaven下的OpenGL4.3水平
另外,“风华2号”渲染能力突出,像素填充率48GPixel/秒,FP32浮点算力1.5TFLOPS,基准跑分成绩领先。工程师现场展示了在麒麟操作系统下风华2号GLmark2基准测试实测评分超过6500。通过Unigine Heaven重度基准测试,充分展现了OpenGL4.3的能力,并在演示过程中突出了曲面细分(Tessellation)的渲染效果,形象立体。同时,“风华2号”还支持4K级三屏高清显示,无论是办公上网视频,还是多媒体娱乐以及苍穹GIS应用上均有上佳表现,现场工程师还即兴试玩了Linux下最新的重量级赛车游戏,画面流畅逼真,渲染能力游刃有余,必将成为游戏玩家和极客们的福音。
▲风华2号演示Linux下重度赛车游戏
“风华2号”还实现了多平台兼容,“风华2号”与统信和麒麟等操作系统完成互认证, 并全面支持飞腾、龙芯、申威、海光、兆芯、鲲鹏等主流国产CPU平台,现场演示了其在飞腾D2000+统信系统上进行苍穹GIS空间地图实时渲染,画面栩栩如生,令人身临其境。更让人惊喜的是,“风华2号”已经流畅支持微软Win10 DirectX图形框架,芯动科技DirectX首席软件架构师章涛表示, “Windows DirectX 11严格要求支持包括曲面细分在内的各种高级渲染技术,开发难度极大。至今,全球只有少数几家公司的GPU支持了Windows DirectX 11。 ”工程师现场演示了Win10操作系统下的QQ通讯、办公上网和娱乐游戏等各种应用,完美实现了多种复杂场景的流畅渲染和曲面细分的细节呈现,3D渲染性能完全能够满足日常工作娱乐所需,具备强大的一站式适用性。
▲“风华2号”在Windows10系统上的渲染展示
问渠哪得清如许,为有源头活水来。“风华2号”的性能优势绝不是凭空而来,凝聚着芯动科技16年来匠心打磨的众多全球顶尖高性能计算IP,正如风华一号采用了全球首款GDDR6/6X Combo高性能IP,使得其显存带宽领先,“风华2号”再现芯动黑科技,自研了全球首款速度最高LPDDR5X显存技术,在桌面级低功耗水平下达到10Gbps带宽新高,助力“风华2号”显卡性能突破,并且向下兼容LPDDR5/4,支持国产长鑫的显存颗粒。“风华2号”GPU自研率非常突出,诸如PCIe3.0、LPDDR5/4、HDMI2.0/DP/eDP1.4/VGA、中国专利的物理不可克隆PUF安全技术,都是芯动长期对外授权的自研优势技术,芯动GPU内核在获得架构授权后持续自主优化,也正因为团队拥有强大的IP自研能力,所以才具备全栈底层核心技术的创新能力,从而实现了青出于蓝而胜于蓝的领先超越。也是由于芯动接口技术的优势,其产品的普适性非常强,板卡支持长鑫、长存等内存、显存、电源管理芯片,成为从IP到板卡的国产化自研率突出的显卡产品,产品性能优越,实现了里程碑式的突破。另外,现场还演示了“风华2号”显卡的AI计算能力,支持科学/边缘计算,AI性能超过12.5TOPS,支持人脸识别、目标识别、语义分割、图像超分辨率等多种场景实时应用,超过传统低功耗桌面显卡的AI计算水平。
▲左上:风华2号能流畅支持曼哈顿重度渲染
▲右下:风华2号在Win10系统上的Demo演示
▲左下:风华2号在Win10系统的重度场景渲染
▲右下:风华2号流畅支持苍穹GIS空间地图
“风华2号”在各种标准测试和演示中可媲美国际主流显卡的综合表现,引起现场观众的阵阵惊叹。不少业内人士亲自去演示室操作“风华2号”桌面系统,确认得到了满意的体验!一位终端客户赞许地说道,“一款国产显卡,做到低功耗低成本的同时又保证了产品的高性能,还能支持无风扇设计,不但Linux和安卓操作系统重度渲染感觉丝滑,支持Windows10也很流畅,出人意料,一看就花了不少功夫。‘风华2号’表现着实惊艳,实属不易!这也说明国产GPU正在进入一个从可用到好用的阶段,未来国产GPU普通用户的显卡体验也将更上一层楼。”
风华系列GPU签约
批量应用跨越里程碑
发布会现场,“风华2号”的惊艳表现,引得一众上下游合作伙伴啧啧称赞,气氛火爆反响热烈,不少客户当场表达了合作和购买意向。会上,中能建投、高澜股份(300499)、统信软件、麒麟软件、泽塔云、优刻得(688158)等上下游合作伙伴与芯动科技现场签约,就风华系列GPU在桌面、数据中心和云计算等领域达成长期深度战略合作,共同致力于国产GPU的软硬件创新和产品商用落地,现场签约合作规模达到5个亿。
一位合作伙伴表示,“芯动科技属于闷声干大事的企业,每次发布产品都不是为了融资而作秀,一出手就是突破性的重量级产品,真正直奔商用主题。之前的‘风华1号’就让我们看到了其在5G数据中心云场景下的广阔前景,如今的‘风华2号’更是不负所望,桌面多操作系统下的渲染流畅、边缘计算和能效比都不输国际同类竞品,团队充满创新活力,让合作伙伴信心满满。大家选择芯动、选择风华产品绝不仅仅是国产情怀驱动。”
十六年集大成
风华GPU永攀高峰
罗马不是一日建成的,国产GPU的机会之门也绝非一蹴而就。“风华2号”的成功开发凝结了芯动团队16年如一日的长期深耕和匠心打磨。芯动科技副总裁毛鸣明介绍,“16年来芯动科技低调务实,敢为人先,攻关克难,团队十年坐得板凳冷,拥有行业创纪录的200多次先进工艺流片,公司在GPU重大开发投入的情况下,还始终保持盈利,并不需要靠任何融资来维持,我们做GPU可以说没有花投资人一分钱,因为全球知名公司逾60亿颗先进SOC芯片背后,都有用到芯动技术,我们的收益可以支持我们健康有机地发展。芯动是一个靠自身硬科技创造核心价值的企业。芯动以前是幕后英雄,在to B的圈子非常有名,为各大半导体代工厂和上下游客户提供赋能。以需求驱动,结合多年积累优势,芯动通过定制化量产在全球化市场中开辟山林,硕果累累。2021年芯动发布的数据中心服务器GPU‘风华1号’,在云应用和数据中心领域首次实现多用户1080P和多路硬件虚拟化、各种高清编解码/转码功能。近半年来,芯动人继续创新,乘胜追击,完成了全套内核底层技术优化和生态适配,不负众望推出低功耗版本的桌面级产品。”
▲GPU展示区人气爆满
已进入产业化的“风华1号”,在现场演示了其同时多路1080P云游戏场景下流畅操作王者荣耀,很多年轻观众惊叹连连,(联通)小沃科技负责人表示,“国内云游戏的布局一直完全依赖国际主流显卡,在高性价比和定制化上总有欠缺,看到这样一款能够支持多路虚拟化的国产GPU,确实十分震撼,不虚此行!”
▲风华1号可同时支持16路1080P云游戏
高技术自研技术的持续演进是GPU迭代能力和核心竞争的关键,芯动科技GPU项目总监何颖表示,“现代GPU的涉及面广、开发应用方面有很多技术壁垒。要拿出一款对标行业先进水平的图形GPU,且流畅兼容各种应用,靠买一款GPU IP是不会有什么建树的。芯动一站式IP和全套体系架构定制服务为风华GPU迅速迭代提供了创新动力:打破内存墙,全球最强GDDR6/6X Combo IP、HBM3/2e IP、LPDDR5/5X/DDR5 IP等高速存储解决方案;32/56G SerDes(PCIe6/5/4)高速通信接口,UCIe Chiplet互连解决方案,以及GPU内核的自主演进等。所以,和苹果公司一样,芯动在最初架构授权的基础上不断优化GPU内核,现已完整独立掌握了GPU内核演进架构图,有了自己的GPU架构把控,并且有能力做到未来三年每年发布两款GPU。比如‘风华2号’能够支持到DX11/OpenGL4.2以上API,这些都是原来的GPU架构所不具备的。”
从事全球顶尖GPU公司领导架构开发超过25年,持3D图形学核心领域国际专利125项的芯动科技首席GPU科学家杨喜乐博士分享道,“芯动在继2021年第一款GPU‘风华1号’发布,迅速推出了具有独立技术特色的低功耗高性能全新GPU‘风华2号’,源于我们有非常优秀的技术团队,从GPU架构研发团队到GPU硬件软件开发团队、高端DDR和总线设计和经验丰富的后端团队等,我们在一起齐心协力攻关克难,进步很快。做GPU是一个非常复杂的事情,但芯动团队从来不畏难,针对办公桌面、车载智能座舱、云游戏、云计算等市场,持续推出GPU新产品,设计演进先进的GPU架构,实现顶尖的渲染性能,同时兼顾低功耗、高度扩展性设计,满足客户的不同需求。未来几款风华GPU,会支持光线追踪等最先进的图形处理生态,进一步支持Direct X12、OpenGL4.6、Vulkan等框架;不仅如此,未来芯动还会开发高性能GPGPU,以满足AI训练推理、图像处理、通用计算、科学及工程计算等广泛应用领域。芯动在GPU领域拥有一流资深的专家队伍,我们有信心有能力接受一切挑战,有信心对标国际顶尖水平,开拓国产GPU的新未来。”
数字浪潮下
国产GPU如何共赢
随着5G新基建、医疗影像、智能制造、自动驾驶、智能座舱、算力泛云化、智能终端国产化等需求暴增,GPU应用不断延展,中国GPU市场规模和增长潜力巨大,目前已经接近500亿元。对此,参与圆桌论坛的专家们表示,“数字经济越发展,应用端对GPU的性能要求越高。性能不匹配、适用性差、功能不完善、系统生态不成熟,显然是国内产品竞争市场时的痛点,也是终端企业、用户不敢用、不愿用国产GPU的原因。但风华系列GPU敢于直击痛点,率先打破紧箍咒,以精准定制、持续迭代的领先产品,发挥功能定制化和响应及时性、产品通用性优势,站上浪潮之巅。”就如何共建新生态和推动国产化GPU进程,圆桌论坛专家们一致认为,行业上下游伙伴、学术机构、科研院所等需要通力合作、共建生态才能实现长期共赢。而国产GPU从能用到好用是一个漫长的过程,需要时间推广、布局、优化、提升,更需要用户的支持、包容与纠错。
▲现场气氛热烈,高朋满座
面对大家对风华系列GPU的高期待,芯动科技总裁敖海先生表示,“芯动的使命是让风华GPU走进千家万户,赋能智慧生活。‘风华2号’是芯动赋能桌面生态链的开始,将拉开风华系列GPU走向大众市场的序幕。先进工艺的强悍迭代能力和团队攻坚克难是芯动的固有优势,我们靠自有IP以及全球代工厂合作伙伴的支持,不断演进先进技术,确保性能持续领先、供应链安全和优势性价比,满足用户的定制需求。目前‘风华3号’已基本完成研发,将为国内用户提供超大算力光追等酷炫性能;GPGPU和座舱产品也正与客户定义中,未来更多定制计算产品线将接踵而至。依靠研发,立足市场,放眼全球,赋能国产GPU产业链我们志在必得!”