2023年,以ChatGPT为代表的生成式人工智能(AIGC)大火,标志着生成式AI元年的到来。生成式AI技术已经在建筑、艺术、工程编程等行业中展现出显著的应用潜能,这些技术通过深度学习和神经网络,学习并模仿人类的语言和视觉艺术模式。例如,ChatGPT能基于输入的文本生成连贯且有创意的回答,而Stable Diffusion则能根据简单的描述创造出精美的图像和视频。
据行业初步预估,生成式AI市场规模将达到1万亿美元,并驱动新一轮内容生成、搜索和生产力相关用例的发展。例如,在传媒和娱乐行业,生成式AI正在重塑内容的生产和消费方式;在教育领域,生成式AI提供了个性化学习材料和交互式学习体验;在商业领域,生成式AI助力广告创意、产品设计和市场分析;甚至在医疗健康领域,生成式AI也开始展现出在疾病诊断和治疗计划制定中的潜力。
手机、PC、物联网……终端侧生成式AI应用有哪些?
随着技术的发展,AIGC也在逐渐从云端向终端侧转移,并引起了移动终端芯片厂商的广泛重视。包括高通在内的各大移动芯片商都在积极推动AIGC在智能手机、PC、汽车、XR设备以及物联网等多种终端品类的普及。
在智能手机领域,生成式AI的应用正在推动算力的实质性增长,特别是在搜索方面。超过100亿次的日搜索量中,移动端占据主导地位。基于生成式AI的查询能提供令人满意的答案,引发用户搜索方式的变化。随着对话式搜索功能的不断强化,智能手机正逐渐成为真正的数字助手。这些设备不仅能够理解文字和语音,还能处理图像和视频等多种输入模式,并提供准确、贴切的回答。
在PC领域,生成式AI应用正变革着生产力。例如,Microsoft Office 365通过集成生成式AI,使日常工作流程更加高效。Microsoft 365 Copilot利用大语言模型和用户数据,将提示转化为生产力工具,支持大语言模型在Outlook、Word、PowerPoint、Excel和Teams中工作。Office用户可以通过大语言模型进行文档编写、电子邮件撰写、数据分析等任务,极大地提高了工作效率。
在汽车领域,AI正在提供高度个性化的体验。车载数字助手支持驾驶员和乘客通过免提界面保持无缝互联,同时为汽车生态系统创造新的收入机会。这些助手不仅能访问个人数据,还能处理来自车辆传感器的数据,提供增强的导航体验、自动化提醒和个性化娱乐内容。在自动驾驶系统中,生成式AI还有助于模拟极端驾驶情况,改进驾驶策略和安全性。
在XR领域,生成式AI正开拓3D内容创作和沉浸式体验的新前景。下一代AI渲染工具能够帮助内容创作者基于文本、语音等提示生成3D物体和场景,创造完整的虚拟世界。同时,文本到文本的大语言模型能为虚拟化身生成自然对话,图像生成模型则为虚拟化身创造外观和服装。未来,人们将能够利用语音提示、图像或视频生成逼真、全动画、智能、可量产的类人虚拟化身。
在物联网领域,行业正在利用生成式AI改进决策质量,优化运营效率,并创造竞争优势。例如,在零售业,生成式AI可以帮助提升客户和员工体验,通过简单提示帮助商店经理进行商品规划、库存管理和促销活动预测;在能源和公共设施领域,生成式AI有助于创建极端负荷场景,预测电力需求和潜在电网故障,提供优质的客户服务。
从云到端,混合AI成关键技术趋势
从云侧到端侧,生成式AI正在进入终端和云端协同工作的混合AI时代,这也是当今AI领域的一个关键趋势。
混合AI的核心优势在于其架构,它通过在云端和终端之间有效分配计算任务,解决了传统云端集中处理模式的计算需求和成本挑战。这种分布式处理机制不仅节省了成本,降低了能耗,还提高了可靠性、隐私保护、安全性和个性化体验。例如,对于简单的推理任务,如日常对话或基本查询,终端侧AI可以独立处理;而对于复杂的数据分析或大规模模型训练,则需要云端的强大计算能力。在混合AI架构下,终端设备处理相对简单的推理任务,而更复杂的任务则由云端处理。随着终端AI处理能力的提升,更多的云端负载可以转移到终端。
混合AI在适当的场景和时间下分配AI计算的工作负载,以提供更好的体验,并高效利用资源,这其中5G承担着连接云端算力和终端应用的关键桥梁。在5G的加持下,混合AI架构使AI在云端、边缘云和终端侧协同运行,使整个系统中的计算和处理能力能够以最有效的方式重新分布,实现更强大、更便利、更高效、更优化的AI。
高通在其发布的《混合AI是AI的未来》白皮书中提到,混合AI将支持生成式AI开发者和提供商利用边缘终端的计算能力降低成本。不仅如此,混合AI架构或终端侧AI还能够在全球范围带来高性能、个性化、隐私和安全等优势。
混合AI的发展离不开终端侧AI能力的提升。随着AI处理逐渐向边缘转移,越来越多的AI推理工作在智能手机、笔记本电脑、XR头显等设备上进行。这些设备通过利用终端侧AI支持多种日常功能,如暗光拍摄、降噪和人脸解锁等,从而推动了混合AI和生成式AI的规模化扩展。终端侧AI的持续演进,使更多性能强大的生成式AI模型能够在终端上运行。
混合AI不仅标志着生成式AI用例的持续演进和主流化,更预示着未来AI技术的新方向。当然,混合AI也面临不少技术挑战,包括提升生成内容的准确性和质量,处理和优化庞大的模型等。不过,随着终端侧AI处理能力的提升,未来有望看到更多性能强大的生成式AI模型在终端设备上运行。这一进展将在成本、能耗、性能、隐私、安全和个性化等方面为用户带来优势。
骁龙X Elite+第三代骁龙8,高通如何推动终端侧生成式AI变革?
作为全球边缘侧终端领域的领导者,高通正积极推动混合AI的发展。从市场规模来看,高通部署的骁龙和高通平台终端数量已达数十亿台,每年还有数亿新终端的加入。这样的生态规模,能让高通的AI创新技术,规模化地应用于数亿台、甚至数十亿台终端上,这对于推动终端侧AI的规模化发展是巨大优势。
在不久前举办的骁龙峰会上,高通总裁兼CEO安蒙强调了生成式AI带来的巨大机遇。他指出,终端侧生成式AI将重塑终端使用方式、创新方法、搜索和与终端的互动方式。预计到2024年,将出现上千个相关用例,而骁龙平台在实现这一未来中将发挥核心作用。此外,高通在峰会期间还带来了在终端侧AI领域的最新进展,发布了两款重磅产品——针对PC市场的骁龙X Elite平台和针对移动市场的第三代骁龙8移动平台。
据悉,骁龙X Elite平台搭载了高通Oryon CPU,采用先进的4nm工艺技术和三丛集架构,包含12个高性能内核,主频高达3.8GHz,双核可增强至4.3GHz,这为持续性计算和密集型工作负载提供了卓越性能;42MB的总缓存和136GB/s的内存带宽是多任务处理和高效能力的关键;平台内集成的Hexagon NPU实现了45TOPS的AI性能,微切片推理技术和张量加速器优化使其高效处理AI工作负载,支持超过130亿参数的生成式AI模型,为用户提供快速准确的AI查询结果和个性化体验。
在连接方面,骁龙X Elite支持最新的5G和Wi-Fi 7系统,确保用户在移动状态下保持高效连接。作为高通在Windows平台上的旗舰产品,骁龙X Elite强调性能、移动性和电池续航能力,高效处理器和调度器能有效处理多线程任务,先进电源管理设计确保长时间电池续航,提供灵活持久的移动计算体验。
高通高级副总裁兼计算与游戏业务总经理Kedar Kondap强调,骁龙X Elite不仅代表着计算技术创新的巨大飞跃,也为消费者带来惊人的能效,提升创造力和生产力。其强大的终端侧AI支持无缝多任务处理和直观用户体验,推动消费者和企业的创作和发展。OEM厂商预计于2024年中推出搭载骁龙X Elite的PC,预计对消费级和商用市场产生深远影响,标志着AI和移动计算领域的重大突破。
面向移动市场,高通则推出了首个专为生成式AI打造的移动平台——第三代骁龙8。该平台将高性能AI注入整个平台系统,为下一代旗舰智能手机带来生成式AI。第三代骁龙8具有迄今为止高通在智能手机平台中集成的最强大终端侧智能,其搭载的高通AI引擎采用了增强架构以提高能效,并面向生成式AI应用大幅提升Hexagon NPU性能,支持大语言模型、大视觉模型以及生成式AI应用。第三代骁龙8能够支持在终端侧运行高达100亿参数的生成式AI模型,并以每秒生成20个token的速度运行大语言模型。
此外,第三代骁龙8也刷新了生成式AI的推理和运行速度。在今年2月底巴塞罗那召开的世界移动通信大会上,高通演示了如何在手机上实现10亿参数的交互式AI,通过约15秒的时间完成20步的推理,把输入的一段文字转成想要的图像。而现在,第三代骁龙8能在不到一秒的时间内,就能实现年初需要15秒才能实现的推理,展现了交互式AI在终端侧实现的可能性和进步速度。
高通高级副总裁兼手机业务总经理Chris Patrick表示,第三代骁龙8将开启生成式AI新时代,支持用户创作独特内容,帮助生产力提升,并实现其他突破性的用例。目前,搭载第三代骁龙8的全新小米14系列、iQOO 12系列智能手机已经发布,第三代骁龙8还在陆续支持全球更多OEM厂商和智能手机品牌的终端,包括华硕、荣耀、魅族、蔚来、努比亚、一加、OPPO、真我realme、Redmi、红魔、索尼、vivo和中兴。
引领技术创新,盘点高通的5G+AI布局
据安蒙介绍,在5G时代刚开始的时候,高通就已经将5G和AI视为驱动下一代创新浪潮的“源动力”技术;当看到5G和个人移动计算的发展时,高通预计5G+AI将会重新定义用户体验。实际上,高通在5G和AI领域已经有多年的布局。
在高通超过15年的AI研发历程中,其AI研究团队在生成式AI领域进行了深入探索。凭借一系列基础研究,以及跨AI应用、模型、硬件与软件的全栈终端侧AI优化,高通始终处于终端侧AI解决方案的最前沿。
在硬件方面,高通AI引擎是高通在终端侧AI的核心优势,它在骁龙平台和高通其他众多产品中发挥了重要作用。高通AI引擎能够以极低功耗提供业界领先的终端侧AI性能,支持当前和未来的用例。此外,高通的硬件加速技术提供了异构计算架构,包括Hexagon处理器、Adreno GPU和Kryo CPU,为终端侧AI应用提供高效运行能力。
在软件方面,高通AI软件栈将高通所有相关的AI软件产品集成在统一的解决方案中。OEM厂商和开发者可在高通的产品上创建、优化和部署AI应用,充分利用高通AI引擎性能,让AI开发者创建一次AI模型,即可跨不同产品部署。高通AI软件栈全面支持主流AI框架,集成了推理软件开发包和工具,并支持多种操作系统和基础设施。
此外,高通的全栈AI研究和优化集中于应用、神经网络模型、算法、软件和硬件。其异构计算方法结合了CPU、GPU和AI加速器以及软件工具。在AI模型效率方面,高通致力于提高能效和性能,采用量化、压缩、条件计算、神经网络架构搜索和编译等策略。特别是量化方面,高通的技术能将FP32模型压缩到INT4,实现显著的性能和能效提。
作为5G研发、商用与实现规模化的重要推动力量,高通也在不断推进移动技术的发展,并积极推动5G+AI布局。例如,高通将在5G和AI领域的技术积累,分享给汽车生态的合作伙伴,共同塑造智能网联汽车用户体验。在过去两年里,高通已经与40多个中国汽车品牌合作推出超过100款新车型,这些车型里使用了高通的骁龙数字底盘,使汽车的数字化、智能化程度得到快速提升。
总结
总结来看,高通的混合AI架构结合了终端和云端处理能力,为大语言模型提供了高效解决方案,优化资源利用和用户体验;而高通的AI软件栈和硬件加速等技术,如Hexagon处理器、Adreno GPU和Kryo CPU,则增强了终端侧AI应用的运行效率,同时高通在AI模型效率上采用量化和压缩策略,显著提升性能和能效。
从最初的率先支持Stable Diffusion等大模型在终端侧的使用,到发布AI白皮书公布混合AI愿景,从推动终端侧AI快速应用至多类终端,到赋能生态厂商和开发者,高通正支持开发者、OEM厂商和其他生态系统创新者快速且经济高效地构建全新生成式AI应用和解决方案,并通过数十亿台搭载骁龙平台的终端,推动生成式AI的规模化扩展,持续引领PC、可穿戴设备、汽车等多类型终端迈向5G+AI新纪元。
编辑:芯智讯-浪客剑