支持本地运行700亿参数大模型,多款AMD锐龙AI Max系列AI PC即将上市

2025年3月18日,AMD 公司在北京举办了主题为 “ADVANCING AI” 的AMD AI PC 创新峰会,携手合作伙伴展示了一些列基于AMD处理器的AI PC新品,凸显了AMD在中国 AI PC 生态系统中的强劲发展势头。

AMD董事会主席及首席执行官苏姿丰(Lisa Su)博士在开场演讲中表示,“如果你留意到DeepSeek(深度求索)近期的成果,就会发现过去几个月的发展令人激动不已,AMD在DeepSeek-R1发布首日就给予了支持,并且我们还与阿里云旗下通义千问密切合作,致力于让人工智能开发变得更快、更开放、更具扩展性。我们的软件发展人员也一直专注于优化DeepSeek,每隔几天,我们就能看到性能有所提升,这充分表明我们在这项技术上的探索仍处于非常早期的阶段。”

苏姿丰博士还在现场宣布,其在今1月CES 2025展会上发布的代号为“Strix Halo”的锐龙AI Max系列已经可以支持本地化运行700亿参数版本的DeepSeek大语言模型(LLM),助力各类生成式AI的应用。

华硕也在现场宣布,其首款基于锐龙AI Max+ 395 的笔记本电脑ROG幻X 2025(128GB内存版本)于3月18日正式开启预约,并称该笔记本是唯一本地流畅运行DeepSeek 700亿参数模型的X86笔记本电脑。

AI PC的三大趋势

AI重新定义了 PC,使其成为更个人化、更智能的设备。AI PC 有潜力彻底改变用户与 PC 的交互方式,能够提升协作效率、提供个性化 AI 助理、增强创作与编辑能力,并助力商业用户提升生产力。​

AMD高级副总裁、计算与图形总经理Jack Huynh在此次创新峰会上也全面阐述了AMD对于AI的坚定承诺,以及领先技术和高性能产品的全面落地。

Jack Huynh在演讲中表示,AI正在给千行百业带来全新的面貌和形态,而推进个人计算变革一直是AMD公司的愿景,也正是AMD率先在x86处理器中集成专用AI引擎NPU,再加上强大的CPU、GPU,率先开启了AI PC的新时代。

相信在AI PC的加持下,尤其是在AMD的大力推动下,无论是行业创造力,还是PC生产力与协作,抑或沉浸式游戏和娱乐,都将焕然一新,给人们的工作和生活带来更高效的全新体验。

Jack Huynh预计,AI PC的浪潮刚刚兴起,全行业都在积极探索,相信它不会是固定的形式和形态,必将不断演进。在他看来,AI PC将有三个方面的演化趋势:

首先就是定制化。各种AI大模型如雨后春笋般涌现,DeepSeek更是带来了革命性的变化,展现了开源的力量。相信在未来的AI PC上,用户可以根据自身的不同需求,选择最适合的甚至是定制的AI模型,从而以最高的效率,获得更好的结果。

其次是自动化。AI的本意就是让我们的工作、生活更加轻松,智能地提供个性化服务,而且不需要过多的人为干预。未来的AI PC,必然能够更加自主地学习我们每个人的习惯、喜好以及日常的工作流程,从而变成更主动、更真实的伙伴,真正解放人类的大脑和双手。

第三是进阶推理。AI学习和逻辑能力很强,但目前仍然非常依赖人类的培养以及现有的知识库,而且对于正确错误的判断能力也还是比较弱。随着技术的成熟,AI必须学会首先自我实时检查推理,具备自我发现错误、纠正错误、完善回复的能力,才能让人放心地得到想要的答案。​

Jack Huynh预计,普及型的AI大模型,参数规模将迅速从7B增至30B,即便在本地端侧也具备足够丰富的知识和强大的能力。同时,输入序列长度将很快达到3000-5000的量级,而首个Token输出时间(TFFT)也将缩短到100ms的量级,从而可以更精准、更快速地响应用户需求。

全球首款运行700亿参数模型的AI PC处理器

Jack Huynh表示,其去年推出的Ryzen AI 300系列推动了AI PC的普及,而AMD在今1月CES 2025展会上发布的代号为“Strix Halo”的锐龙AI Max系列已经可以支持本地化运行700亿参数的大语言模型(LLM),相关AI PC产品即将上市。

据了解,全新的锐龙AI Max系列处理器采用了 Zen 5 CPU 和 RDNA 3.5 GPU 架构,并运用先进的芯粒(chiplets)封装技术。每个 Zen 5 CPU 核心位于独立的 CCD 上,最高两个 CCD 提供 16 个 Zen 5 核心,核显(iGPU)最高拥有 40 个 RDNA 3.5 计算单元。此外,该处理器还采用 LPDDR5x 内存标准,内存带宽高达256GB/s,集成 50 TOPS“XDNA 2” NPU,为 Windows 11 AI+ PC 提供领先的 AI 性能,也为新一代AI PC带来了革命性的突破,为游戏玩家、创作者和普通用户提供了卓越的性能和强劲的动力。

根据AMD此前公布的数据显示,在与竞争对手英特尔酷睿Ultra 9 288V的对比中,Ryzen AI Max+ 395在3D渲染能力方面整体性能快2.6倍,图形性能提升最高 158%。

在AI 性能方面,得益于锐龙AI Max+ 395配备了高达50 TOPS的XDNA 2架构NPU,在 LM Studio 中的 AI 性能比 NVIDIA GeForce RTX 4090 高出 2.2 倍,同时功耗降低了87%。同时得益于锐龙AI Max系列还支持高达128GB的统一内存,其中最高可将96GB用于图形处理,这也使得搭载该处理器的系统能够实现无缝、可靠的多任务处理,并支持运行700亿参数的超大规模的AI模型,使得该处理器成为了全球首款运行700亿参数模型的AI PC处理器。

Ryzen AI Max 300系列包括以下四款型号:

Ryzen AI Max (Pro) 395:16核32线程,最高主频5.1GHz,80MB缓存,40组CU。

Ryzen AI Max (Pro) 390:12核24线程,最高主频5.0GHz,76MB缓存,32组CU。

Ryzen AI Max (Pro) 385:8核16线程,最高主频5.0GHz,40MB缓存,32组CU。

Ryzen AI Max Pro 380:6核12线程,最高主频4.9GHz,22MB缓存,16组CU。

众所周知,目前DeepSeek-R1模型700亿参数版本在FP16精度下大概需要140GB显存,如果降低INT4精度,对于显存的需求将会降低到约35GB,但是这会带来体验的降低。

在此次AI创新峰会上,AMD邀请了模优科技上台介绍了其异构加速解决方案,可以在保持相对较高精度的前提下,利用锐龙AI Max+ 395处理器平台灵活分配计算单元,在128GB的共享内存上,即可流畅运行DeepSeek-R1模型700亿参数版本,生成的速度可以达到超过10 Token/s。

预计搭载锐龙AI Max系列处理器的产品将于2025年第一季度上市。

多款锐龙AI MAX系列AI PC已经开启预约

在AMD锐龙AI Max+工作站展区,AMD全面展示了基于全新AMD锐龙AI Max处理器带来了出色AI应用体验。其中,搭载AMD锐龙AI Max+ 395移动处理器的华硕ROG幻X 2025二合一笔记本展示了在本地流畅加载运行AMD StrixHalo LLM应用。

华硕ROG幻X 2025二合一笔记本使用CNC一体化设计机身,2.5K分辨率和180Hz刷新率的星云屏,整机重量为1.2千克,厚度为1.2厘米,搭载70Wh电池,采用加大尺寸键帽和触控板。处理器方面,这款产品首次搭载了16核心32线程的AMD锐龙AI Max+ 395处理器,最高可配置板载128GB LPDDR5X 8000MHz内存,并采用了第二代ArcFlow风扇散热设计。

这台二合一笔记本能够流畅运行Llama 70B大模型,Llama 70B是Meta推出的高性能大语言模型,相比Llama 13B和7B版本,其核心优势在于参数规模的大幅提升(700亿参数),显著增强了模型的复杂任务处理能力。虽然其对硬件资源的需求较高,但通过AMD对其优化后的推理效率使得单位token激活参数成本降低,可在AMD笔记本平台运行来更广泛地适合企业级应用和科研场景。

在本次的AMD AI创新峰会上,华硕正式宣布,ROG幻X 2025(128GB内存版本)于3月18日正式开启预约,并称该笔记本是唯一本地流畅运行DeepSeek 700亿参数模型的X86笔记本电脑。不过,具体价格并未公布。

值得一提的是,AMD展示区还展示了搭载锐龙AI Max+ PRO 395移动处理器的惠普战99 Ultra锐龙版笔记本电脑,并展示了运行AMD Creative studio的魅力。

据介绍,ACE++是阿里开源的基于指令的图像创作与编辑工具,依托上下文感知填充技术和 FLUX.1-Fill-dev 算法,仅凭一张图即可生成风格一致的新图,无需额外训练。无论是全新创作、修复老照(去除路人、更换背景、修改面部)还是多步复杂编辑,都能通过统一指令轻松完成。充分发挥Strix Halo大显存优势,ACE++可加载超30B参数,并首次在 Windows平台支持PyTorch,通过 ComfyUI构建多样图像创作工作流。

3月17日,惠普全新的战 99 Ultra锐龙版已于昨日上架京东并开启预约,3 月 26 日开售,锐龙 AI MAX+ PRO 395,128GB内存,2TB闪存版本,定价25999 元。

编辑:芯智讯-浪客剑

 

0

付费内容

查看我的付费内容