继百度、三六零、商汤等科技巨头发布各自大模型后,阿里巴巴“通义千问”大模型4月11日也亮相云峰会。阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇表示,未来阿里巴巴所有产品都将接入“通义千问”大模型,进行全面改造。
据介绍,阿里云已经累积了从飞天云操作系统、芯片到智算平台的“AI 云计算”的全栈技术实力,阿里云将把这些AI基础设施和大模型能力向所有企业开放,共同推动AI产业的发展。
阿里所有产品都将接入“通义千问”
目前钉钉、天猫精灵率先接入大模型测试,将在评估认证后正式发布新功能。
根据当天预告的Demo演示,钉钉接入通义千问之后的钉钉可实现近10项新AI功能,可以通过类似微软Copilot“副驾驶”的设定,用户可随时随地唤起AI,帮助创作诗歌小说、撰写邮件、生成营销策划方案等,全面辅助办公。在钉钉会议中,通义千问可以随时生成会议记录并自动总结会议纪要、生成待办事项。通义千问还可以帮助自动总结未读群聊信息中的要点,以及拍照生成小程序场景。
天猫精灵接入通义千问后,可以更拟人更聪明,知识、情感、个性、记忆能力大幅跃升。它支持自由对话,可以随时打断、切换话题,能根据用户需求和场景随时生成内容。
“未来所有软件都值得接入大模型升级改造,我们将开放通义千问的能力,为每一家企业打造自己的专属GPT。”阿里云智能CTO周靖人表示,阿里云将提供完备的算力和大模型基础设施,让包括创业公司在内的所有企业和机构更好地实现创新,让中国整体的AI能力有全方位的提升。
在发布会当天,阿里云还宣布将与OPPO安第斯智能云联合打造OPPO大模型基础设施,基于通义千问完成大模型的持续学习、精调及前端提示工程,未来建设服务于其海量终端用户的AI服务。同时,吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技等多家企业表示,将与阿里云在大模型相关场景展开技术合作的探索和共创。
回应与Open AI差距
张勇指出,大模型是一场“AI 云计算”的全方位竞争,超万亿参数的大模型研发,并不仅仅是算法问题,而是囊括了底层庞大算力、网络、大数据、机器学习等诸多领域的复杂系统性工程,需要有超大规模AI基础设施的支撑。
对于大模型领域阿里与引领者OpenAI的差距, 阿里方面表示,OpenAI是目前全球大模型研究领域的引领者,ChatGPT是非常优秀的模式,通义千问目前还在不断学习和成长中。尤其GPT-4在推理、数学等方面有了非常不错的表现,通义千问尚不能及。当然,通义千问也有自己较为擅长的领域,比如在文本对话、阅读理解等方面。
总体来说,阿里处于全球领先的大模型研发梯队,具备语言大模型、多模态大模型、大模型底层训练平台的完整布局。
打造AI产业基础设施
随着AI模型数据量变大,AI产业正从“手工作坊”组成的轻工业走向集约化生产,需要高性能、低成本的体系化基础设施才能完成工业化生产。国内绝大部分中小公司没有能力自建动辄需千卡甚至万卡以上的大模型基础设施,即便对于很多头部企业,从0到1不断训练、优化大模型也并不经济,各行各业都需要成本足够低的AI基础设施。
阿里云从2019年开始投入大模型研发,是国内大模型领域最早的先行者,其曾训练完成全球首个10万亿参数AI大模型,近期推出实测效果接近ChatGPT的大模型“通义千问”,成为国内唯一支撑过万亿参数以上大模型的“飞天智算基础设施”。
周靖人介绍,“飞天智算基础设施”可提供的从IaaS、PaaS到MaaS的三层系统服务能力。
其中,智算IaaS服务包括可支持最大十万卡GPU单集群规模、可承载多个万亿参数大模型同时在线训练的智算集群,可为万卡规模AI集群提供无拥塞通讯的自研RDMA网络架构等;智算PaaS服务以机器学习平台PAI为核心,可支持万卡的单任务分布式训练规模,AI训练效率提升可达10倍,推理效率提升可达6倍,覆盖全链路AI开发工具与大数据服务,深度支持了通义大模型的研发。
另外,智算MaaS服务包括通义大模型系列和以之为基础的企业定制大模型,以及国内首个“模型即服务”开放平台魔搭社区,魔搭现已汇聚超800个优质开源模型,总用户量超100万,模型累计下载次数超1600万,成为国内规模最大的模型社区。
让算力更普惠、让AI更普及
张勇回顾阿里云的发展历程,过去十年阿里云自研核心技术,全面服务数字化进程。中国移动互联网的发展基本在阿里云上发生,企业从买计算机到按需购买算力就能开始创业,带来了巨大的效率提升。随后更多企业觉醒,各行各业在云上对全生产要素的数字化,形成了风起云涌的数字化时代。
AI大模型加速了智能时代的到来,张勇认为,所有企业在智能化时代都将站在同一条起跑线上,互联网公司和非互联网公司不存在先进或者落后的区别,传统企业有弯道超车的机会。他认为,所有产品都值得用大模型重做一遍,未来将看到应用爆发、效率革命,AI将成为各行各业新型生产力。
未来十年,阿里云将全面拥抱智能化时代。张勇表示,智能化时代带来算力的爆发,同时也提出了更高的要求,阿里云将为AI时代提供好算力基础和大模型能力,全面服务智能化进程。
为此,阿里云要做好核心两件事:让算力更普惠、让AI更普及。
首先,阿里云将进一步降价,释放技术红利。阿里云通过软硬一体技术的研发,扩大自研CPU倚天710、云数据中心处理器CIPU、自研数据中心网络等核心技术应用,推动技术创新、规模化运营和成本降低的正循环,不断降低客户用云成本。
过去十年,阿里云提供的算力成本下降了80%,存储成本下降了近9成。今年,阿里云将推出一款更接近云计算终极形态的算力产品,这款被命名为通用Universal实例的产品进一步屏蔽了传统IT的硬件参数,让数据中心真正成为一台超级计算机,为中小企业和开发者提供普惠的算力。通用Universal实例的价格有大幅降低,对比上一代主售实例最高可下降40%。
大幅降价和开放核心产品的免费试用,将推动产业进一步从传统IT向云计算转移。目前,中国IT市场的云计算渗透率不到15%,中国数据中心的CPU利用率仅为10%左右。云计算可以大幅提升计算资源的利用率,云数据中心内的CPU平均利用率,可以达到传统数据中心的5倍以上。
其次,阿里云将推动AI进一步普及。正如前面所介绍的,未来阿里巴巴所有产品未来将接入大模型,全面升级。此外,阿里云还将面向企业提供更普惠的AI基础设施和大模型能力。
据介绍,未来每一个企业都可以通过阿里云调用通义千问的全部能力,也可以结合企业自己的行业知识和应用场景,训练自己的企业大模型。比如,每个企业都可以有自己的智能客服、智能导购、智能语音助手、文案助手、AI设计师、自动驾驶模型等。
张勇表示,云计算是AI大规模普及的最佳方式,“未来,我们希望在阿里云上训练一个模型的成本,能够降低到现在的十分之一,甚至是百分之一。即使是中小企业,也能通过云平台获得AI大模型的能力和服务。”
编辑:芯智讯-林子 综合自网络