立尔讯推出DeepSeek训推一体机,助力企业智能化转型

立尔讯推出DeepSeek训推一体机,助力企业智能化转型

2月26日消息,国产服务器生产商及行业应用方案提供商立尔讯科技推出了DeepSeek训推一体机解决方案,该方案涵盖了DeepSeek R1/ V3满血版和蒸馏版的两种版本的本地化部署,以助力企业智能化转型。目前立尔讯已有基于英伟达GPU方案的版本,同时还在与昆仑芯合作,即将推出基于昆仑芯P800的DeepSeek训推一体机解决方案。

AI训推一体机需求爆发

在2024年12月-2025年1月期间,深度求索公司(DeepSeek)陆续发布了DeepSeek V3和R1版本模型并同步开源,在 一系列标准和开放式基准测试中,表现出与世界领先的闭源模型(包括GPT-4o、o1、o1-mini等)相当的性能。特别是其蒸馏模型,在保持了较高性能的同时,极大的降低了对于硬件算力的需求。可以说,DeepSeek的横空出世,极大降低了企业部署和应用大模型的难度,推动了大模型推理应用的快速落地。在以下各种竞赛模拟测试中性能和OpenAI o1相当:

图片

虽然目前像阿里云、百度云、腾讯云等众多的云服务厂商都推出了DeepSeek云服务,但是一些对数据隐私有严格要求,更注重信息安全,或者有二次训练需求的用户来说,更倾向于在本地部署DeepSeek R1/V3模型,且DeepSeek对于硬件的需求相较于同等参数量的Llama 3等开源模型大幅降低,这极大的推动了企业级用户通过本地化部署DeepSeek R1/V3模型助力企业AI转型的热情。

通常企业需要组建专业的团队去搭建AI基础平台,包括GPU集群,调试分布式框架等一系列的工作,不仅部署周期长、还需要长期的运营和维护。相比之下,AI一体机通过标准化配置提供了快速的,简单的本地化部署方案,无需专业运维团队,做到开箱即用,并且拥有更高的安全性、更低的时延和更好的数据隐私保护。

今年2月,超讯通信就宣布拿下了合计14.88亿元的基于沐曦C500方案的训推一体服务器大单。足见目前市场对于AI一体机需求的火爆程度。

立尔讯推出高性价比DeepSeek一体机方案

DeepSeek大模型根据不同的模型规模分为不同的版本,以满足不同应用场景的需求。从最初的V1版本到当前的R1蒸馏版及其满血版671B(6710亿参数),DeepSeek的进化不仅体现在模型的参数规模和推理能力上,也在硬件需求、应用场景和部署成本等方面逐步优化和调整。

其中, 以DeepSeek R1蒸馏版(70B)为例,其模型规模为70B(700亿参数,基于Qwen或Llama架构的蒸馏版本),对于硬件要求相对较低,FP16显存需求为140GB,但是4-bit量化显存只需要约35-50GB。因此,2张RTX 4090(24GB显存)或4张RTX 3090(24GB显存)并行即可基本满足本地化部署需求。

对此,立尔讯推出了基于AD102芯片+ 48GB定制显存的解决方案,实现了单卡即可并运行DeepSee-R1 70B蒸馏模型,实测显存占用约42.9GB,在8个并发请求时吞吐量表现最佳(66.31 tokens/s) 。如果采用8卡服务器方案,则可满足64个并发请求的高性能吞吐输出。

立尔讯推出DeepSeek训推一体机,助力企业智能化转型

从成本上来看,基于AD102-48GB的单卡方案与A100 80GB对比,大模型推理平均时长可节省30-40% ,综合使用成本仅为A100 80GB的18%或L40的60%。

面对中大型企业对于性能、精度及并发要求更高的DeepSeek满血版(671B)模型的部署需求,立尔讯的基于4台8张AD102-48GB加速卡的服务器也能够基本满足需求,同时成本也相比A800/A100/H100等方案更低。

同时,立尔讯可以为客户提供一整套的软硬件解决方案,不仅可以助力客户实现私有化DeepSeek大模型的快速部署,还可聚焦人工智能应用和服务场景,为客户提供领先的智能算力管理解决方案。

立尔讯推出DeepSeek训推一体机,助力企业智能化转型

对于政企或有国产化需求的用户,立尔讯也拥有全国产化的AI服务器解决方案,CPU芯片支持鲲鹏、飞腾、海光等国产CPU,AI芯片方面则可支持海光、天数智芯、寒武纪等国产AI芯片。此外,立尔讯还透露,目前正在与百度进行合作,后续即将推出基于昆仑芯P800的DeepSeek训推一体机解决方案。

关于立尔讯

立尔讯成立于2010年,经过十多年的发展,已经从一家专注于高端服务器行业应用定制服务商成长为一站式企业信息数字化方案提供商。目前公司已经建立了完整的供应链体系,严苛的定制化标准,获得了超过300多家客户的认可。目前产品线包括通用服务器、GPU服务器、数据中心交换机、企业级交换机等一系列产品,囊括了英特尔、AMD、鲲鹏、飞腾、海光等主流CPU方案,以及英伟达、海光、沐曦、昆仑芯等众多AI芯片方案。

编辑:芯智讯-浪客剑

0

付费内容

查看我的付费内容