阿里云发布通义千问2.5:性能全面赶超GPT-4 Turbo!

5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4Turbo,成为目前最强的中文大模型。同时,通义千问最新开源的1100亿参数模型在多个基准测评收获最佳成绩,超越Meta的Llama-3-70B,成为开源领域最强大模型。
性能全面赶超GPT-4Turbo
据介绍,相比相比通义千问2.1版本,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文能力更是持续领先业界。
在权威基准OpenCompass上,通义千问2.5得分追平GPT-4Turbo,是该基准首次录得国产大模型取得如此出色的成绩。
通义千问的多模态模型和专有能力模型也具备业界顶尖影响力。通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越GeminiUltra和GPT-4V,目前已在多家企业落地应用;通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单BigCode的头名选手,还是国内用户规模第一的智能编码助手通义灵码的底座。

开源1100亿参数的Qwen1.5-110B

2023年8月,通义千问宣布加入开源行列,为顺应不同场景用户需求,通义推出参数规模横跨5亿到1100亿的八款大语言模型,小尺寸模型如0.5B、1.8B、4B、7B、14B,可便捷地在手机、PC等端侧设备部署;大尺寸模型如72B、110B能支持企业级和科研级的应用;中等尺寸如32B试图在性能、效率和内存占用之间找到最具性价比的平衡点。

在此次会议上,阿里云还发布了通义千问的最新款开源模型,1100亿参数的Qwen1.5-110B,该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型;在HuggingFace推出的开源大模型排行榜OpenLLMLeaderboard上,Qwen1.5-110B冲上榜首,再度证明通义开源系列业界最强的竞争力。

据阿里云CTO周靖人在会上透露,未来通义大模型还会持续开源。“开发者的反馈和开源社区的生态支持,是通义大模型技术进步的重要助力。”

免费开放通义全栈能力

会上,阿里云还宣布原通义千问APP宣布更名为“通义APP”,将集成通义大模型全栈能力,免费为所有用户提供服务。

通义APP拥有超强文档处理能力,单次可处理多达1000万字的长文档,还能同时解析100份不同格式的文档,是金融、法律、科研、医疗、教育等领域专业人士的工作提效利器;基于通义大模型出色的音视频理解能力,通义APP能够精准高效地进行音视频文件的识别理解、摘要总结、多语言翻译,可同时上传处理50个音视频文件;通义APP还集成了国内最受欢迎的智能编码助手通义灵码,能帮助所有人随时随地在手机上写代码、读代码、学习编程技能。

据了解,今年以来,通义APP先后推出了“全民舞王”“全民唱演”“通义照相馆”、AI智能体等现象级应用,在“全民舞王”频道,用户上传一张照片就能跳“科目三”等舞蹈;在“全民唱演”频道,用户用一段音频就能驱动肖像照中的人物唱歌说话。这些热门应用背后都是通义实验室自研的前沿AI模型,未来,通义APP还将推出更多以新技术驱动的新玩法,让所有人都能获得领先的大模型技术体验。

通义大模型已通过阿里云服务超9万家企业

在过去一年中,通义千问发展出了文生图、智能编码、文档解析、音视频理解等能力,企业客户和开发者可以通过API调用、模型下载等方式接入通义,个人用户可从APP、官网和小程序免费使用通义。

根据最新数据显示,通义通过阿里云服务企业超过9万、通过钉钉服务企业超过220万,现已落地PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。

会上,周靖人还公布百炼大模型平台最新进展。百炼平台从模型开发、应用开发到算力底座全面升级,更加易用、更加开放,引入更多模型,还率先兼容LlamaIndex等开源框架,企业可自由替换能力组件来适配自身系统。针对当下企业最关注的RAG链路,百炼提供灵活开放的企业级检索增强服务,5到10行代码即可搭建RAG应用,让大模型拥有“最强外挂”。

一直以来,阿里云都强调要成为“AI时代最开放的云”,通过开放的算力平台、开源的自研模型、优质的模型服务,帮助客户抓住大模型时代的机遇。如今,开源开放战略正为阿里云带来新的商业增长。

编辑:芯智讯-林子

0

付费内容

查看我的付费内容