7月6日,国际顶级学术期刊《自然》(Nature)杂志正刊发表了华为云盘古大模型研发团队的最新研究成果——《三维神经网络用于精准中期全球天气预报》(《Accurate medium-range global weather forecasting with 3D neural networks》)。
华为云盘古气象大模型获突破
数据显示,这是近年来中国科技公司首篇作为唯一署名单位发表的《自然》正刊论文。《自然》审稿人对该成果给予高度评价:“华为云盘古气象大模型让人们重新审视气象预报模型的未来,模型的开放将推动该领域的发展。”
据介绍,华为云盘古气象大模型是首个精度超过传统数值预报方法的AI模型,速度相比传统数值预报提速10000倍以上。目前,盘古气象大模型能够提供全球气象秒级预报,其气象预测结果包括位势、湿度、风速、温度、海平面气压等,可以直接应用于多个气象研究细分场景,欧洲中期预报中心和中央气象台等都在实测中发现盘古预测的优越性。
今年5月,台风“玛娃”走向受到广泛关注。中央气象台表示,华为云盘古大模型在“玛娃”的路径预报中表现优异,提前五天预报出其将在台湾岛东部海域转向路径。在刚刚结束的第19届世界气象大会上,欧洲中期预报中心也指出,华为云盘古气象大模型在精度上有不可否认的能力,纯数据驱动的AI天气预报模型,展现出了可与数值模式媲美的预报实力。
华为云盘古大模型研发团队发现,AI气象预报模型的精度不足主要有两个原因:第一,原有的AI气象预报模型都是基于2D神经网络,无法很好地处理不均匀的3D气象数据;第二,AI方法缺少数学物理机理约束,因此在迭代的过程中会不断积累迭代误差。为此,团队创造性地提出了适应地球坐标系统的三维神经网络(3D Earth-Specific Transformer)来处理复杂的不均匀3D气象数据,并且使用层次化时域聚合策略来减少预报迭代次数,从而减少迭代误差。通过在43年的全球天气数据上训练深度神经网络,盘古气象大模型在精度和速度方面超越传统数值预测方法。
华为云表示,未来将联合全球气象机构,继续探索并发挥AI在气象领域的应用潜力,为农林牧渔、航空航海等各行业提供支持。
华为盘古大模型即将正式上线
今日“2023 世界人工智能大会”正式开幕,华为轮值董事长胡厚崑在开幕式演讲当中宣布:华为将在 7 月 7 日的“华为云开发者大会”上正式推出盘古大模型 3.0。盘古大模型已经深耕行业 10+,业务场景 400+。
据了解,盘古大模型早在2019年就有开始研发,2020年11月在华为云内部立项成功,到2021年4月发布NLP(自然语言处理)大模型、CV(机器视觉)大模型和科学计算三个基础大模型。
后续又发布了矿山、药物分子、气象、海浪等行业大模型。工商资料也显示,华为早在2019年就已经申请了“PANGU”商标,并于2021年注册成功。
于对于盘古大模型定位,华为内部团队确立了三项最关键的核心设计原则:
一是模型要大,可以吸收海量数据;
二是网络结构要强,能够真正发挥出模型的性能;
三是要具有优秀的泛化能力,可以真正落地到各行各业的工作场景。
目前,华为即将上线的“盘古系列AI大模型”分别为NLP大模型、CV大模型、科学计算大模型,此外还有暂未确定上线的多模态大模型。
据了解,盘古NLP大模型是首个千亿参数中文预训练大模型,CV 大模型则首次达到 30 亿参数。盘古 CV 大模型业界最大 CV 大模型、首次实现兼顾判别与生成能力、在 ImageNet 上小样本学习能力上的业界第一;在科学计算大模型方面,紫东.太初是全球首个图、文、音三模态大模型;自此登上《自然》杂志的则是盘古气象大模型,可提供秒级天气预报。
值得注意的是,华为盘古 NLP 大模型由华为云、循环智能和鹏城实验室联合开发,具备领先的语言理解和模型生成能力:在权威的中文语言理解评测基准 CLUE 榜单中,盘古 NLP 大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录;总排行榜得分 83.046,多项子任务得分业界领先,向人类水平(85.61)迈进了一大步。
具体来看,盘古 NLP 大模型首次使用 Encoder-Decoder 架构,兼顾 NLP 大模型的理解能力和生成能力,保证了模型在不同系统中的嵌入灵活性。下游应用中,仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配,这一模型在智能舆论以及智能营销方面都有不错的表现。
华为表示,盘古大模型解决了传统AI开发的作坊式开发、样本标注代价大、模型维护困难、模型泛化不足、行业人短缺等难题。
编辑:芯智讯-林子