7月6日,在“世界人工智能大会”期间,由上海开放处理器产业创新中心、芯原微电子(上海)股份有限公司主办,中国RISC-V产业联盟协办的以“智”由“芯”生为主题的“RISC-V和生成式Al论坛”在上海世博中心召开。在此次论坛上,中国RISC-V产业联盟理事长、芯原创始人、董事长兼总裁戴伟民以《AIGC芯片的机遇和挑战》为题进行了分享。
自2022年底以来,随着以ChatGPT为代表的生成式AI的持续火爆,各大互联网巨头都纷纷加码生成式AI的研发。根据前 OpenAI 的安全研究员Aschenbrenner(于2024 年 4 月因“泄露信息”被OpenAI解雇)预测:在2025-2026年,人工智能将超过大学生智力水平;2027年,AI模型将能够完成人工智能研究人员/工程师的工作,届时一个领先的人工智能实验室将能在一分钟内训练出一个GPT-4级别的模型。
按照目前的生成式AI的技术路线,要想实现达到甚至是超越人脑的智能,就需要持续扩大模型的参数规模,这也给计算力的要求带来了指数级的增长。
公开数据显示,GPT-3拥有1750亿个参数,算力需求约为 315000百亿亿次;GPT-4约有1.7万亿个参数,算力需求约为 1.35亿百亿亿次;一个拥有10万亿参数的理论模型将需要 130亿百亿亿次的计算量,将需要1060万张NVIDIA A100 PCle 80GB芯片或3336个采用256 个Grace Hopper芯片的DGX GH200系统。如果要实现超级人工智能,可能将会需要1000万张H100加速卡,耗电会耗差不多相当于中国一个中等省份的电力消耗。这就会面临很多问题,到那个时候全球可能只有少数国家的少数企业才能够负担的起。
但是在现阶段,全球有非常多的企业都在研发自己的AI大模型,仅在中国市场,就有超过100款的AI大模型,可谓是“百模大战”。对于,芯原董事长戴伟民博士表示:“当前中国市场的‘百模大战’,我觉得更像是‘群模乱舞’,是在浪费电,实际上不需要这么多个。我们预计2028年中国基础大模型的数量将少于10个,最好是5个。”
至于生成式AI所需的算力芯片的发展趋势,戴伟民博士认为:“GPU/GPGPU并不是一定是Transformer的最优算力芯片,现在已经有越来越多的专用芯片开始出现(比如Groq“语言处理单元” LPU,Etched AI推出Transformer专用ASIC“Sohu”等),以挑战英伟达最先进的产品。”
“如果把树干比作通用大模型,树枝比作垂域大模型,树叶比作应用,那么就对应就需要有关键的“三张卡”,即对应的树干的云上训练卡、对应树枝的端上微调卡、对应于应用的推理卡。预计到2028年,端侧的微调和推理卡未来将远大于云上的训练卡。戴伟民博士形象的解释道。
从研究机构Counterpoint Research对于AI芯片市场的预测数据来看,在生成式AI驱动下,笔记本电脑、智能手机和服务器等关键市场的半导体收入将迎来快速增长,预计到2030年,关键计算领域的半导体收入将达数万亿美元,其中生成式AI将驱动服务器领域的半导体收入将增长至2024年的2.7倍;将使智能手机领域的半导体收入将增长至2024年1.86倍;将使PC领域的半导体收入将增长至2024年1.9倍。
戴伟民博士还围绕AI PC、AI手机、AI眼镜等几个关键终端应用,强调了AI技术将带来的巨大市场机会。以及在此趋势下,芯原作为半导体IP和设计服务供应商所能够提供的产品和服务,以及多个与客户在AI上的合作案例。
在AI所需的关键IP方面,芯原股份在嵌入式AI/NPU领域全球领先,其NPU IP已被72家客户用于128款AI芯片当中,主要应用于物联网、可穿戴设备、智慧电视、智慧家居、安防监控、服务器、汽车电子、智能手机、平板电脑、智慧医疗等10个市场领域。目前,集成了芯原NPU IP的AI类芯片已在全球范围内出货超过1亿颗。
除了专用的AI加速的NPU IP之外,在目前被广泛应用于通用AI加速的GPU方面,芯原也拥有一系列自研的GPU IP。芯原在GPU领域也已经耕耘了20多年,拥有70项国外专利,集成了其GPU IP的芯片已在全球累计出货近20亿颗,并进入了近千万辆汽车。
在目前生成式人工智能大模型在云端及边缘端蓬勃发展的趋势之下,芯原根据目前市场的需求,基于自身NPU IP可伸缩可扩展的特性,已发展了覆盖从高性能云计算到低功耗边缘计算的生成式AI解决方案,包括专门面向边缘端大模型的NPU IP——VIP9X00以及AI-GPU IP,以及面向云端大模型的Tensor Core GPU IP——CCTC-MP。
此外,戴伟民博士认为,Chiplet和先进封装也将是AI芯片发展所需的两大关键技术。目前,芯原拥有平台化的Chiplet方案及相关技术,可提供从Chiplet、Die-to-Die接口、封装到软件的整体解决方案,可以满足面向数据中心的高性能AIGC芯片需求,也可助力构建面向智能汽车的下一代智慧驾驶平台芯片。
另外,戴伟民博士还指出,目前CoWoS先进封装的产能紧张,并且成本高企,未来性价比更高的面板级封装需求未来将会迎来高速增长。
“生成式AI的未来充满无限可能。随着技术的不断进步和应用的深入,AI将在各个领域释放出巨大的潜力,推动人类社会迈向新的高度。如果说以苹果iPhone4(2010年发布)为代表的智能手机开启了移动互联网“牛市” (2013 - 2015年),那么以ChatGPT(2023年推出)为代表的大模型引领大算力硬件的“牛市”将引领下一轮牛市。”戴伟民博士在演讲最后这样预测到。
编辑:芯智讯-浪客剑