毫无疑问,人工智能(AI)一直是近两年来发展最快也是最为热门领域,无论是国外的谷歌、亚马逊、苹果,还是国内的BAT等科技巨头都纷纷入局,大批的AI创业公司更是如雨后春笋般涌现。
得益于中国政府对于AI的重视以及众多中国企业的大举投入,中国在AI领域也取得了飞速的发展。更为重要的是,中国拥有7.3亿的网络用户,同时也是全球最大的智能终端市场,每天可产生极为庞大的数据资源。可以说,AI技术的发展离不开数据的驱动。据国家发展改革委披露的数据显示,2020年中国将成为世界第一数据资源大国,中国每天产生的数据总量有望达到8000EB,占全球数据的18%以上。而数据对于AI来说则是相当于是“粮食”或“石油”。正因为中国所拥有的庞大的数据资源优势,也使得中国成为了AI领域发展最快的国家之一。
根据美国白宫发布的两份报告显示,自2014年以来,中国不仅在深度学习领域所发表的学术文章数量上超越了美国,而且在深度学习领域被引用学术文章数量也已超过美国。此外,在计算机视觉、自然语言处理、智能机器人和语音识别能等领域,中国已超越美国走在了世界前列。因此,不少媒体和业内人士纷纷表示,中国的人工智能实力很快将超过美国。但是,实际上,中国与美国在人工智能领域的差距依然巨大。
中美AI实力差距依然巨大
根据此前腾讯研究院的中美AI实力对比报告显示,截止到2017年6月,全球AI企业总数为2542家,其中美国1078家,占42%;中国592家只占23%。美国的AI企业数量是中国的近两倍。另外在AI九大热门领域,美国的融资额更是达到了中国的23倍。而在AI处理器/芯片这种基础层领域,美国企业的数量也大大超过中国,是中国企业数量的2.3倍。
不久前,市场研究公司Compass Intelligence对100多家人工智能(AI)芯片公司进行评估,最终发布了一份全球AI芯片企业排名,在公布的前24名的榜单上,从国家和地区分布来看,美国有13家,而且排名前三的也都是美国公司(英伟达、英特尔以及IBM)。中国公司只占据了7个席位,排名最靠前的是华为,排名第12位。随后是联发科(14)、Imagination(15)、瑞芯微(20)、芯原(21)、寒武纪(23)和地平线(24)。如果算上即将被高通收购的NXP和即将把总部搬回美国的博通,美国就将会有15家企业在榜单上,数量将超过中国企业两倍。
当然,仅从中美AI相关领域的企业数量或者排名榜单上的企业数量对比,并不能完整反应两国之间的AI实力差距。那么是否有更系统的评判方式呢?
中国AI实力只有美国的一半?
近期,牛津大学也发布了一份题为《解密中国AI梦》(Deciphering China\'s AI Dream)的报告,作者牛津大学博士、青年经济和政治学者杰弗里·丁(Jeffrey Ding)指出中国目前的AI实力实际仅约为美国的一半。在这份报告中,首次提出了“国家AI潜力指数(AIPI)”这一概念,AIPI主要考察四项基本指标,分别是:硬件、数据、算法和商业,以此来衡量一个国家在AI方面的综合实力。
下面我们就来看看,在AI硬件、数据、算法和商业这四个方面,中美之间的差距:
1、硬件(占比25%)
在AI硬件方面,由于具备较高的技术门槛和投入成本以及较长的研发周期,AI芯片的研发是最为困难的。这类AI芯片又有两大类:一类是可以被用于机器学习/深度学习训练的传统通用型芯片,比如CPU/GPU等;另一类则是专为执行AI算法所设计的芯片,比如谷歌的TPU和一些PFGA芯片。
为了衡量中国在AI硬件上的实力,该报告从“半导体生产的国际市场份额(2015)”及“FPGA(现场可编程门阵列)芯片生产商的融资情况(2017)”两个方面的数据来进行分析。
首先,以全球半导体市场份额来看(2015年数据),美国占据了全球半导体市场50%的份额,而中国仅只有4%的份额。其次,在FPGA芯片生产商的融资上,中国相关企业2017年获得的投资是3440万美元,占全球FPGA厂商融资额的7.6%;而美国这一数据是1.925亿美元,占据42.4%的份额。
报告据此计算得出,中国硬件指数为(4 7.6)/2=5.8,美国硬件指数为(50 42.4)/2=46.2。
另外报告指出,目前GPU则被广泛用于深度学习计算领域,在美国前十大芯片制造商当中,有4家GPU厂商,其中Nvidia更是极为强势。而中国在GPU方面仍没有一家企业(芯智讯注:现在Imagination已被中资收购,算是在一定程度上弥补了这个缺憾),几乎完全依赖国外的企业。
虽然在中国10大芯片制造商中,有6家有专门从事ASIC芯片的研发,但是美国也拥有更多的从事ASIC芯片的企业,而且实力上也更强。比如谷歌此前已经推出了第二代的TPU。当然这些ASIC芯片的灵活性不如FPGA。而在FPGA领域,美国和中国各有两家FPGA芯片制造厂商。不过,在2017年美国的FPGA公司获得了1.925亿美元的融资,两家中国的FPGA公司只获得了3440万美元的融资。
该报告也承认,中国在超级计算机方面的成功展示了它在人工智能领域追赶世界的潜力。2014年,中国在超算Top500榜单上的名额仅为76个,占比15.2%,而美国则有232个,占比46.4%。但是到来2017年6月,全球超算Top500榜单上,中国已经拥有了159个名额,占比31.8%,美国则有168个,占比33.6%,显然中国在超算上的整体实力已经与美国相当。而在未来的人工智能发展中,超级计算设备可能变得更加适用。
但是需要指出的是,目前中国AI硬件实力的提升,主要还是依靠进口关键器件和收购来提升的。由于这一战略受到美国和欧盟的更严格审查,中国正在大力发展国内芯片设计和制造行业,并在强大的超级计算机上进行长期投资。但是尽管如此,中国国内生产的集成电路只满足了国内13%的需求,中国的集成电路进出口贸易逆差自2005年以来已经翻了一倍多。因此,如果中国要在人工智能硬件领域中迎头赶上,可能需要很长时间。
2、数据(占据25%)
前面芯智讯有提到,AI技术的发展离不开数据的驱动,特别是机器学习必须要有足够数据来训练,而庞大的数据资源优势则是中国AI发展的优势之一。根据CCID的报告,到2018年中国大陆将占到全球零售电子商务市场的50%以上。咨询公司预计,到2020年,中国将拥有全球20%的数据;到2030年,中国将拥有全世界30%的数据。因此,在数据方面,中国拥有绝对的优势。
不过以2016年的数据来看,中国拥有全世界20%的数据;美国的数据量占全世界的5.5%。据此,该报告计算得出,中国数据指数为20,美国数据指数为5.5。
另外报告指出,中国的数据量之所以丰富,除了人口众多、移动互联网发展迅速以外,中国相对松懈的隐私保护策略,更加使得中国科技巨头能够方便收集大量的数据,并在政府间共享。此外,中国的互联网数据保护主义也是促使中国互联网崛起的关键,比如对于Facebook和谷歌的屏蔽,从而使得微博和百度等国内平台的崛起。从中我们可以看到数据的优势。
此外该报告还表示,数据是人工智能发展的稀缺资源,中国可以对其公司和研究机构的资源进行排他性控制,但是如果能够在更多的平台和国家之间共享更多的数据,中国的AI厂商也可以从全球数据共享中获益。
3、算法与研究(占据25%)
AI研究和算法开发是人工智能发展的关键因素。该报告将这一指标的考核划分为两个部分,一部分是AI人才数量,另一部分是在AAAI上发表的论文数量。
报告称,中国的研究人员能够快速复制世界上任何地方开发的最先进的算法。中国也有大量的AI研究人员和优秀的毕业生,但是在最具创新性的研究领域以及顶级AI人才数量方面仍与美国有差距。
虽然数据显示,2014年,中国在人工智能研究领域的相关专利注册和深度学习领域的文章发布数量上超过了美国。但是,这并不是一个有质量的证明。该报告称,根据人工智能发展协会(AAAI)的数据显示,2015年中国学者在AAAI上发表的论文为138项,占据全世界的20.5%;而来自美国学者发表的成果数量为326项,占比高达48.4%。
另外根据麦肯锡的数据显示,中国在基础研究方面落后于美国和英国。尽管中国学者发表的AI论文在数量上近年来显著提升,但在论文被引用数量上(除去自我引用),美国和英国的AI研究论文更有影响力,被引用的也更多。
报告称,在AI人才数量上,2017年美国STEM专业的毕业生中,有约78700人从事AI研究,占据全世界的26.2%。而中国只有约39000人从事AI研究,占全世界AI人才的13.1%。在AI人才上美国处于领先的关键在于,美国拥有大量世界一流的大学,拥有更加成熟的人工智能商业生态系统。另外在美国,近50%的AI研究人员有超过10年的工作经验,而在中国只有25%的人有超过10年的工作经验。所以这不仅仅是AI人才数量上的差距,AI人才质量上的差距也很大。
【芯智讯注:STEM由科学(Science)、技术(Technology)、工程(Engineer)和数学(Mathematics)首字母组成,是美国鼓励学生主修科学、技术、工程及数学的一项计划。在美国国土安全局网站上可以查到一个长长的属于STEM计划的专业列表,比如化工、计算机科学、物理、数学、生物科学和航空航天等理工科。】
根据以上的数据,该报告计算得出,中国在算法与研究指数上的得分是(13.1 20.5)/2=16.8;美国的得分则是(26.2 48.4)/2=37.3。
4、商业(占据25%)
在AI商业化评分指标方面,该报告主要从以下三个方面来进行比较:
1、人工智能公司数量:
根据2017年6月的数据,全球AI公司总数约为2542家,其中42%来自美国,而中国则只有23%。报告称,美国的生态系统能够培育出更具竞争力的人工智能创业公司。
2、2012-2016年对AI公司的总投资额
根据乌镇研究所的报告称,在2012-2016年间,中国对于AI领域的总投资额是26亿美元,占据全球的6.6%;而美国的投资总额则高达172亿美元,占据全球的43.4%。
但是,很多研究数据对于“核心人工智能”与“相关产业”并未完全区别,因为其界限本来就很模糊。这也使得一些研究机构的数据会有较大差异。比如来自IT Juzi和腾讯研究所的另一份报告给出了一个截然不同的估计,该数据显示,美国在AI领域共获得了148亿美元融资,占据全球51.10%的份额;而中国的融资规模则为96亿美元,占据全球的33.18%的份额。
报告认为,数据相互冲突背后的另一个因素是人工智能领域的快速变化。作为参考,从2014年到2016年,中国新成立AI公司的数量占中国AI公司总量的55%,这三年中国AI投资的规模占中国科技企业总融资总量的90%以上。
另外报告还指出,近年来,大型科技公司竞相收购具有领先优势的AI公司来获取相关技术和市场,有132家美国科技巨头从收购当中获益。数据显示,从2012年到2017年7月,全球总共有79次规模较大的AI企业收购案。其中美国公司收购了66家AI公司,而中国公司只收购了3家AI公司。
3、2017年AI初创公司全球融资总额
在AI初创公司2017年全球融资总额上,中国AI初创企业的总融资额占据全球AI初创企业融资总额的48%,美国公司总融资额则占据全球的38%。报告称,在过去的一年里,中国在AI领域的融资额获得了爆炸式的增长,要知道2016年中国AI初创企业的总融资额仅占全球的11.3%。尽管对中国AI领域的规模的统计数据各有不同,但可以肯定的是,中国的AI行业在过去几年里在绝对和相对方面都有了显著的增长。
虽然,在这一项指标上,中国领先美国。但是,该报告也指出,在CB Insight的AI 100榜单中,美国有39家AI创业公司在榜单之上,而中国只有3家AI创业公司上榜。
根据以上数据,报告计算得出,中国在商业指数上的得分是(23 6.6 48)/3=25.9;美国的得分则是(42 43.4 38)/3=41.1。
结论:
从以上四个方面的对比来看,中国虽然再数据方面具有较大的领先优势之外,在硬件、算法与研究、商业化上面与美国仍有较大差距,特别是再硬件上差距更是巨大。
根据以上四个项目的评分相加再,中国最后的总得分是5.8 20 16.8 25.9=68.5,美国最后的总得分是46.2 5.5 37.3 41.1)/4=130.1。显然从这个综合评分来看,中国的AI综合实力确实只有美国的一半。
国内专家:报告不专业,中美差距不会这么大!
对于此份报告的内容,国内有专家称中美在AI领域确实存在一定差距,比如在半导体、芯片等方面确实差距比较大。但从整体实力上看,中美AI差距或许并没有那么大。
国内相关专家表示:“首先,该报告选取的评判要素、标准不够全面,值得商榷。其次,该报告的数据不全面。比如在对AI公司的总投资额和AI初创企业融资额上,数据不太准确,中国在AI领域的跨国并购和对初创企业投资的速度在加速,从国家资本到民营机构都非常看重对优质AI公司的投入,而且力度非常大。第三,中国在商业化领域的落地能力较强,这项指标没有加入,比如图像识别在中国市场的应用已经非常广泛,反观美国则比较滞后。”
不过在芯智讯看来,这份报告还是比较有参考意义的,首先决定AI综合实力的关键因素,技术(包括硬件和软件)、人才、资金、商业化等方面,该报告都有覆盖。虽然国内有专家认为“中国在商业化领域的落地能力较强,这项指标没有加入”,但是实际上,中国的这项优势是体现在了该报告当中的“数据”项上。正因为中国的人口、网络用户以及互联网上的优势,才使得中国的AI能够有足够大量的数据训练,从而能够快速的进入到实际应用。而且同样也是因为用户基数够大,所以各项的应用能够被快速的推广,而AI在应用端的快速和广泛的部署,也进一步促进了更多数据的产生和数据的价值化,进一步强化了中国在这块的优势。
另外,该报告所引用的数据也都还是相对比较权威的数据,其所展现的中美在AI领域的差距,也与之前据腾讯研究院发布的《中美两国人工智能产业发展全面解读》的报告所反应的基本相符。
此前,腾讯研究院发布的《中美两国人工智能产业发展全面解读》显示,在AI基础研究和人才领域,美国基础层人才数量是中国的13.8倍,世界人工智能排名前20的大学中,美国占16所,中国一所都没有。目前中国只有不到30所大学拥有专注于AI的研究室,其中仅有清华大学、中国科技大学等少数几所高校在国际有一定竞争力。
在AI企业数量和融资方面,截止到2017年6月,全球AI企业总数为2542家,其中美国1078家,占42%;中国592家只占23%。美国的AI企业数量是中国的近两倍。另外在AI九大热门领域,美国的融资额更是达到了中国的23倍。特别是在AI处理器/芯片这种基础层领域,美国企业的数量也大大超过中国,是中国企业数量的2.3倍。
这些数据也都反应了中国与美国在人工智能领域的实际差距。虽然我们在人工智能应用端确实走在了世界前列,比如国内语音识别已经开始在智能家居上的广泛应用,以人脸识别为代表的机器视觉在国内各领域都开始有广泛应用(比如刷脸支付、智能安防),但是我们不能忽视在应用之上的更为核心的在硬件芯片、软件算法等方面差距。这就好比中国的智能手机产业,虽然全球智能手机大都是中国生产的,而且全球前五的智能手机厂商当中,中国已占据了3席,但是智能手机的众多核心器件乃至安卓系统都是掌握在美国厂商手中。同样,对于中国目前AI产业的繁荣我们也应该清楚的认识到中美之间的差距,我们还有很多的薄弱环节需要去弥补。
作者:芯智讯-浪客剑