国产自主GPU 架构“天狼星”在北京亮相

GPU(Graphic Processing Unit)即图形处理器,是数字世界图形内容生成的基石,不管是桌面应用、游戏、电影、数字孪生还是元宇宙;与此同时,强大的并行计算能力业已成为各种应用加速的主流手段,正广泛应用于科学计算和人工智能。然而,我国 GPU 芯片基本全部依赖进口。随着美国不断加码限制英伟达、AMD 向我国供应高端 GPU 芯片,我国进口 GPU 也受到极大的限制。这些多重因素,更加促使国产 GPU 企业奋起直追。

6 月 15 日,国产自主 GPU 架构 " 天狼星 " 鉴定及发布会在北京举办。

GPU 架构 " 天狼星 " 出世

GPU 架构 " 天狼星 " 由国内企业中天恒星科技有限公司(Advanced Technology Stellar,简称中天恒星 /ATS)自主研发。

中天恒星研发团队由卡内基梅隆大学电子与计算机工程博士、清华大学软件学院、微电子学研究所副教授、NVIDIA 合作教授邓仰东博士率领。邓博士是 GPU 通用计算最早研究人员之一,被誉为 "GPU 通用计算先行者 "。邓博士长期从事图形处理器体系结构、并行计算研究和芯片产品开发工作;曾设计出全球第一个基于 FPGA 的 GPU 仿真平台;研究成果在 ISCA、MICRO、等顶级会议和期刊发表。邓博士撰写多部教材和专著,其中《数字集成系统的结构化设计与高层次综合》入选清华大学及多所大学研究生教材,《异构处理器 OpenCL 编程导论》是国内 GPU 异构计算第一部教材,《3-Dimensional VLSI》是三维集成电路的第一部专著。

" 天狼星 "GPU 架构有几大亮点:一是具有 3D 图形引擎 2D 图形加速 视频引擎。二是自主可控 / 灵活优化的指令集和 VLIW/SIMD 机器指令集 ( ICCD ’ 13 ) ;其中,自主可控 / 灵活优化的指令集,保证 GPU 芯片迭代的软件兼容。三是 SIMT 计算框架,充分利用图形应用的数据并行性 ( DATE ’ 12.ICCD\'13,TVLSI15 ) 。四是支持物理真实渲染 ( ACMComputingSurvey ’ 14,SIGGRAPHASIA\'14.15 ) 。五是 ShaderCore ( Graphics ProcessingCluster ) ,包括 SIMT 独立指令执行单元、以 32 位浮点 ALU 为基础的统一图形架构 ( ICCD13 ) 以及集成寄存器堆、纹理 / 数据缓存。六是延迟聚集式全局线程调度技术 ( ISCA20、TPDS21、TCAD\'21 ) 。七是具有良好性能伸缩性的片上互联架构 ( MICRO\'20、TPDS ’ 21 ) 。

此次发布的天狼星的主要有三个技术优势:第一、面向亿级订单市场,以独立显卡 GPU 芯片主流产品为突破口,瞄准需求广阔、增长强劲的亿级刚需市场,突出性价比优势;第二、拥有完全自主知识产权,以清华大学超过 10 年研究基础为依托的自研核心架构,确保产品迭代自主可控。以基础理论研究为基础,从数学公式推导开始,从架构设计、算法模型、原理验证、硬件实现、驱动开发等环节全部正向设计。核心架构完整知识产权,已申请专利和著作权数百项,数十项已获授权;相关研究成果发表于 ISCA、Micro、IEEE TPDS、IEEE TCAD 等顶级会议和期刊;第三、完备的交付能力,上下游产业链准备充分,确保产品量产自主可控;芯片设计完成全面验证,确保流片成功;软硬件接口符合国际标准,确保芯片装机即可使用,包括操作系统认证:Windows WHQL;API 认证:Open GL Conformance Test;外围接口认证:HDMI DP CTS;专业测试认证:PHYlayer 和 LIINK layer;质量体系认证:显卡 3C 认证(中国)、 日本 VCCI 、欧盟 CE、美国 FCC。

得到业界专家高度认可

当前 ,Imagination 和 Vivante 两家公司是主要 IP 来源,这些 IP 主要是针对移动应用的 GPU 内核,不适合桌面应用。此外,购买第三方的 IP,难以形成成熟的图形显卡级 GPU,核心电路专利无法自控和自主迭代。

中天恒星联合创始人、总架构师邓仰东博士表示:" 很多国产的 GPU 的 IP 授权主要购买的第三方。中天恒星的路线有所不同,核心的图形引擎完全自主设计的,所以 3D 图形引擎这块不涉及到别人的知识产权,也没有 IP 的问题,全部是我们自己拥有,从 0 到完整架构的实现,都是我们自主的技术。"

自研 GPU 架构存在极高的技术挑战。邓仰东分析指出:"GPU 设计有几个地方非常复杂:一个是架构级的设计,这其实是个统筹的艺术。GPU 本身的资源,在所谓的 uni 版的 shader,所有的计算资源是一样的,大家都用 32 比特或者 64 比特的浮点运算单元,这是一个配合的问题。有很多个核共享 L2 的 cash,然后每个核内有自身的计算单元,还有通往片外的各种通道,实际上片上还有一些针对图形的,比如像纹理的缓存;这些虽然很容易知道是什么样的模块,难的是如何配合起来实现整体性能最优。换言之,如何通过统筹协调,能够适应绝大多数图形应用。在大多数情况下,均衡的设计保持性能每秒至少 30 帧,这是一个极具挑战的地方。二是,架构仿真的时间非常长,需要经验也需要直觉,去找出架构问题到底出在哪里。这方面也是一个很大的挑战,需要有多年的积累才能去做这件事。"

克服重重考验终将 " 亮剑 "

依托研发团队多年研究成果,中天恒星从数学公式推导开始,架构设计、算法模型、原理验证、硬件实现和驱动开发等环节全部正向设计,核心 IP 完全自主可控,拥有图形 GPU 完整知识产权,并已申请专利和著作权数百项,其中 25 项已获授权,相关研究成果发表在 ISCA、Micro、IEEE TPDS、IEEE TCAD 等顶级会议和期刊。

2019 年,第一代 " 天狼星 " 架构芯片设计验证完成。2021 年,第一代 " 天狼星 " 架构 GPU 诞生;2022 年,定义第二代 GPU 架构 " 大角星 ";2023 年,第一代 " 天狼星 " 架构 GPU 实现量产。

GPU 架构取名为 " 天狼星 " 有着独特的寓意,中天恒星创始人黄永博士指出:" 我们的架构全部是以恒星来命名的。Stellar 是恒星、星宿、星座的意思,引申出来有超一流、卓越的含义。第二代架构命名为大角星;大角星是第二亮的恒星。只是因为距离地球更远,所以看起来没有天狼星亮;实际上,大角星比天狼星更亮,其亮度是太阳的 110 倍。"

据悉,2024 年,中天恒星会继续优化基于 " 天狼星 " 架构的 GPU。2025 年,将量产第二代 GPU 架构 " 大角星 "。

国产自研 " 天狼星 "GPU 架构的推出,无疑推动国产 GPU 芯片朝前迈出一个新的高度。

当前 , 美国对中国的科技打压仍在继续,对中国限制供应高端 GPU 芯片的打压不会减弱。国内的国产替代处在深入推进期,国内下游应用市场采购国内自主可控的芯片的自主性和迫切性更强,这进一步激发中国企业自研 GPU 芯片的热情,为国产 GPU 的发展提供了巨大的助力。

0

付费内容

查看我的付费内容