英特尔发布数据中心GPU Flex系列,加速智能视觉云应用

英特尔数据中心GPU发布:代号Arctic Sound-M,算力可达150 TOPS

8月25日消息,在今年5月10日晚间召开的英特尔On产业创新峰会上,英特尔推出了面向多媒体转码、视觉图形处理和云端推理的单一GPU解决方案:代号为 Arctic Sound-M(ATS-M)的英特尔数据中心 GPU ,支持每秒150万亿次运算,并集成了AV1 硬件编码器。现在,这款英特尔数据中心GPU正式更名为“Flex系列”,并将于未来几个月面世。

据介绍,英特尔数据中心GPU Flex系列能够帮助客户突破孤立且封闭的开发环境的限制,同时降低数据中心对于不得不使用多个分离、独立的解决方案的需求。英特尔为客户提供的单一GPU解决方案,能够在不牺牲性能或质量的情况下,灵活处理多种工作负载。这一优势可让它在支持多种云工作负载如媒体传输、云游戏、人工智能、元宇宙等新兴视觉云使用场景的同时,降低或优化相关的总体拥有成本。

英特尔副总裁兼超级计算事业部总经理Jeff McVeigh表示:“我们正处于一场由更多用户、更多应用和更高分辨率所共同驱动的‘像素爆炸’变革中。当今的数据中心基础设施承担着计算、编码、解码、传输、存储和显示视觉信息的巨大压力。英特尔Flex系列GPU采用突破性的设计,更有针对性地满足了现阶段的相关计算需求,同时也为未来的沉浸式体验提供了灵活性和可扩展性。”

强大性能

Flex系列GPU可满足图像质量、部署密度和时延方面的要求。在集成了基于硬件的、业界领先的AV1编码器的基础上,Flex系列数据中心GPU可以提供更出色的媒体转码吞吐性能和解码吞吐性能,且能耗低于同类型解决方案。它还实现了30%以上的带宽增幅,显著降低了总体拥有成本。在软件层面,它可广泛支持主流媒体工具、API、框架和最新的编解码器。

基于英特尔的Xe-HPG微架构,并由生态系统中的广大硬件供应商和软件开发者提供支持,英特尔数据中心GPU Flex系列可以为诸如媒体分析、智慧城市、医疗影像等场景的AI推理工作负载提供在CPU和GPU之间灵活扩展的能力,而不会让开发者受限于封闭的专有软件中。能够支持每秒 150 万亿次运算(150 TOPS)。

重要应用

媒体处理、媒体传输、视觉人工智能推理、云游戏和桌面虚拟化等应用场景在数据中心领域呈现快速成长趋势。受此驱动,面向视觉云的数据中心GPU芯片市场规模也有望在2026年增长至150亿美元。如此快的增长势头,正发生在一个很大程度上受限于封闭的、需要授权许可的代码开发模式的行业中。

Flex系列GPU解决方案堆栈的出现,不仅能突破上述限制,还具备相比于其他解决方案的显著优势,即更高的灵活性和可扩展性,并能降低能耗。它能帮助解决方案提供商们降低总体拥有成本,让他们能够以更少数量的服务器满足更大规模用户的应用需求。

Flex系列GPU解决方案堆栈通过oneAPI(使用加速计算技术的高效手段)实现,能让开发人员摆脱封闭编程模式带来的经济和技术负担。相较于使用专利语言有可能会令后续开发被锁定在该语言上的局限,oneAPI是一种开放式的可选方案,它通过一套完整的、经过验证的工具为现有编程语言和并行化模型提供补充,从而充分释放硬件的性能潜力。它让用户得以开发开放的、易于移植的代码,更大限度地利用多种跨英特尔CPU和GPU的组合。

性能详述

英特尔数据中心GPU Flex系列将首先提供媒体处理和传输以及Android云游戏相关能力。

1、媒体处理和传输

视频会议、流媒体和社交媒体的视频处理需求已经改变了数据中心内的计算资源需求。Flex系列GPU的媒体架构包含多达四个Xe媒体引擎,专注于满足现代数据中心对于高密度视频流的需求,同时无需妥协质量:
以低于同类型解决方案的能耗,提供更出色的媒体转码吞吐性能和解码吞吐性能。
单卡能够支持多达36路视频流的1080p60转码吞吐量。
单卡能够支持8路视频流的4K60转码吞吐量。
在4U服务器中扩展到10卡配置时,它可以支持多达360路视频流的HEVC-HEVC 1080p60转码吞吐量。

● Flex系列GPU基于硬件的开源AV1编码器可节省30%以上的带宽。Flex系列GPU的媒体引擎还支持包括HEVC、AVC和VP9在内的业界广泛使用的编解码器并可以提高其性能。

● 利用英特尔®Deep Link超级编码功能,英特尔®数据中心GPU Flex系列140可在单卡上配备两套编解码设备,可以满足业界的“一秒时延”要求,同时提供8K60实时转码5。此功能适用于AV1和HEVC HDR格式。

2、Android云游戏

云游戏正呈现快速增长趋势,亟需更灵活的解决方案来为用户提供更多的实时游戏流。Flex系列GPU为提供更优的游戏服务质量而打造,可在各种设备上带来畅爽的游戏体验,这一点已经在近90款时下热门的Google Play* Android游戏中得到验证。

● 单个Flex系列170 GPU可以支持多达68路720p@30fps数据流,而单个Flex系列140 GPU可以支持多达46路720p30数据流(基于特定游戏的测试结果)。

● 当使用6个Flex系列140 GPU进行扩展使用时,它可以支持多达216路720p30数据流。

开放式软件堆栈

开发人员可以访问整合了开源组件和工具的综合软件堆栈,以有效地实现Flex系列GPU面向视觉云工作负载的功能,包括对oneAPI和OpenVINO™的支持。英特尔的oneAPI工具套件(包括英特尔®oneAPI视频处理库oneVPL、英特尔®VTune™ Profiler等)帮助开发人员能够更快地交付应用程序和服务。

面市计划

包括戴尔科技集团、HPE、新华三、浪潮、联想和超微在内的全球系统提供商将推出搭载Flex系列GPU的系统。在未来几个月里,从媒体传输和Android云游戏工作负载开始,搭载Flex系列GPU的解决方案将陆续面市。随后将是面向Windows云游戏、人工智能和虚拟桌面基础架构工作负载的系统和解决方案。

​编辑:芯智讯-林子

0

付费内容

查看我的付费内容