6月26日,国内知名的人工智能公司Rokid(若琪)在杭州举办“2018 Rokid Jungle”发布会。虽然在此之前,Rokid曾发布过Rokid Alien、Rokid Pabble两款智能音箱产品,但是这次发布会却是Rokid成立4年以来的首场大型公开活动。
Rokid创始人兼CEO Misa(祝铭明)在会上发布了三款重量级新品。除了Rokid Me便携智能音箱以及Rokid AR Glass这两款智能硬件产品之外,Rokid还发布了KAMINO18 语音AI专用芯片。
便携智能音箱Rokid Me
此前市场上虽然有众多的智能音箱产品,但大都是针对家庭使用场景设计的。而此次,Rokid针对年轻人群打造了一款便携智能音箱Rokid Me。
Rokid Me采用航空铝材质一体机身和独特的双面圆弧造型,拥有银、粉、蓝、紫四款色彩。同时内置了若琪语音助手和6个麦克风阵列,能够实现360度5~10米远场拾音。
Rokid Me还搭配有4000mAh大电池,能够保障8小时以上的连续使用。
在功能设计上,Rokid还独具匠心地在Me这款产品上,创造了摇一摇切歌,翻转暂停的手势交互操控。
特别值得一提的是,Rokid Me之所以采用航空铝材质一体机身,是因为航空铝材质非常的坚固,一方面可以使得Rokid Me更加的抗摔,另一方面也使得Rokid Me即使在高音量的情况下机身也不变形,所以全部的声音会传导给扬声器,这也可以保证高保真的音质。
对于Rokid Me的音质,Misa非常自信的表示:“我敢向你们保证Rokid Me在音质上不输一些专业的音箱,因为我们采用了专业音箱一模一样的技术再加上智能,所以Rokid ME是非常典型的以音箱为核心诉求的一个产品,而不是以所谓的智能。”
另外,为了让用户能够更好的与Rokid Me进行交互,所以Rokid做了非常独特的声学设计,将麦克风和扬声器都做成了直接朝上的设计,使得Rokid me跟用户之间交互可以非常直接,不受任何干扰。但要完成这一点对工程、软件、算法及整个技术提出了巨大的挑战。扬声器与麦克风之间只有1厘米的距离。
Misa也坦言:“我们为此做了巨大的努力,但我们牺牲了一些东西,比如在2到3米内的远场识别效果很好,距离远可能会差一些,但这个产品本来就是一个随身的产品,所以你就牺牲这些,这是Rokid对产品的理解。”
在定价方面,Rokid Me售价799人民币,将于6月26日16:00在Rokid官网商城和官方微信商城开启预购。7月26日开启全渠道销售(包括天猫旗舰店、京东旗舰店、官网商城、官方微信商城和线下门店)。
目前智能音箱市场竞争非常激烈,价格更是达到了100元以下,比如不久前百度推出了89元的小度智能音箱。相比之下,Rokid Me的799元的这个价格还是相对较高的。
对此,MIsa表示“我们的东西的确不便宜,不过Rokid Me的799元的这个价格是包含了2年的QQ音乐服务,而且参加预购的用户还能额外享受1年喜马拉雅巅峰会员的独家权益,其实是非常划算的。同时,我们想要给用户的也是最好的东西,而不是是塑料的非常LOW的材料,非常糟糕的设计,非常糟糕的品质,最后你只是可以用。但我相信现在,尤其是年轻人,Me就是为年轻人设计的,一定会选符合他自己品质的东西,这是我们一直的观点。”
来自未来的Rokid Glass
早在2012年4月,谷歌就曾推出一款炫酷的AR眼镜Google Glass,它具有和智能手机一样的功能,可以通过声音控制拍照、视频通话、发信息、导航以及上网等功能。2014年谷歌又推出了第二代的Google Glass。但是最终,这款产品还是走向了失败,没有走向量产。
究其原因,一方面可能是由于体验相对较差,虽然Google Glass比较轻便,但是实际上,它采用的是分体式的设计,其眼镜仍需要连接到一个盒子,也就是其“大脑”,才能工作。另一方面则是由于其高昂的售价,以及缺乏生态。还有一方面则是引发的用户对于其侵犯隐私的担忧。
在此次发布会上,Rokid推出了号称“目前全球可穿戴性最强的AR一体眼镜”——Rokid Glass量产版。相对于今年1月在CES上公开亮相的Rokid Glass原型机来说,经过 5 个多月的研发,Rokid Glas量产吧采用了全新的设计、更为轻巧、功能也更加强大。
Rokid Glass量产版延续原型机的一体化设计,整体体积缩小40%,采用合金边框取代之前的塑料材质,美观且更好的散热。在人体工程学方面,Rokid Glass 可适应 90%以上用户的头型和瞳距,吸附式矫正镜片让近视用户也能够正常佩戴。整机质量轻盈,重量120克,仅为微软HoloLens 的1/4。
Rokid Glass拥有全球领先和独创的单镜片 AR 光学技术,将光效率较传统方式提升 50%,全彩全高清的 OLED 微显示屏,其光学分辨率为1280x960,刷新率 60fps,视场角大于30度,大画幅显示,让视觉更加逼真,相当于看一个5米以外的110寸电视画面。
硬件配置方面,Rokid Glass采用高通骁龙 835 处理器,拥有强大的计算处理能力。眼镜上方搭载了一颗 1300 万像素带光学防抖的摄像头,让远距离视觉识别、二维码扫描更加方便快速。
除此之外,Rokid Glass支持人脸识别功能,官方称其识别准确率高达99.7%,可应用于社交、安防、医疗等领域。比如,通过Rokid Glass拍下一张名片以及对应的人的人脸图像,那么下次再见到这个人是,Rokid Glass就会提示这个人的个人信息,这对于具有“脸盲症”的职场人士来说简直是福音啊!
Rokid CEO Misa与首席设计师兼美国产品研发负责人姜公略现场演示Rokid Glass的人脸识别
同时,Rokid Glass还支持物体识别。商家只需上传多张不同角度的商品图片即可,还能添加视频、动态图片、评论等多媒体素材,用户就可以利用Rokid Glass对商品进行识别,让线下购物体验更加丰富。Rokid Glass利用 WiFi 定位技术,可实现商圈内部一米范围内的精准定位,解决商超内室内导航这个痛点。
另外,在操控方面,Rokid Glass支持语音操控和触控式操控(眼镜脚侧边有一个小的触摸板)。
在此前Google Glass备受争议的公共隐私问题方面,Rokid首席设计师兼美国产品研发负责人姜公略表示:“我们现在做的设计是将摄像头藏在里边的,这是第一点,不会让人觉得可能被侵犯,而不愿意接近。另外,我们在边上还会加一个非常小的LED灯,所以在拍照和录像的时候别人是知道的,日本所有的手机在拍照的时候都要求要有声音,我们还要面对国际市场,所以我们在这一点上必须做到。”
对此,笔者认为其实可以采用AR场景识别以及定位等措施,在一些敏感的公共领域,禁止用户去启动这个功能,就像针对无人机的电子围栏一样,这样可以更好的避免一些隐私问题。对于笔者的这个建议,Rokid方便也表示后续会考虑。
在生态建设方面,为了方便开发者进行行业应用开发,Rokid Glass搭载 Android 7.0 系统,4G 内存,64G 存储,可自定义安装各种开发工具包,可广泛应用于室内/外导航、线下购物、社交、远程协助、旅游、展览、教育、工业 4.0 等行业及场合。
Rokid创始人兼CEO Misa 表示,Rokid Glass是目前全球可穿戴性最强的AR一体眼镜,承载了Rokid在硬件,光学和人工智能领域的技术积累,也是Rokid在人机交互技术探索上的一次飞跃。此次发布的Rokid Glass将于今年四季度正式量产。
但是对于产品定价,Rokid方面并未透露,只表示会控制在与旗舰手机相当的价格。另外,Misa还表示,今年可能市场上还买不到Rokid Glass,因为产能已经被一些特定渠道的客户给定完了。
语音AI专用芯片KAMINO18:已接到百万片订单
随着今年“中兴事件”的爆发,引发了国内整个行业对于“自主芯片”的重视。一时间,一大批的企业纷纷宣布进军半导体领域,要自己做芯片。其中,就包括很多的人工智能(AI)算法公司。
不过,相对于一些为了“玩概念”而跨界进入芯片领域的厂商来说,AI算法公司推出自己的芯片则是一件很自然的事情。因为,AI算法的实现需要依赖于芯片,而不同的算法对于芯片的需求也是不同的,对于特定算法,专用型的AI芯片的加速要远远优于通用型芯片。这也是为什么AI算法厂商大都有自己推出或者联合芯片厂商推出定制化的AI芯片。
比如,今年CES期间,声纹识别技术厂商Speakin就曝光了自己的一款声纹识别芯片和模组(详情可参看:《智能语音助手设备大热,全球首款声纹识别芯片及模组曝光!》)。今年5月,语音识别厂商,云知声也推出了自主设计研发的第一代UniOne物联网AI芯片及其解决方案雨燕(Swift),可支持多种深度神经网络模型,官方称其性能较通用方案提升超50倍。
强大的KAMINO18
Rokid 北京AI-Lab负责人高鹏博士介绍KAMINO18
此次,Rokid发布的AI语音专用芯片KAMINO18,是一款针对AI语音设计的SoC芯片,内部集成了ARM Cortex-A7内核、NPU、DSP、MEMORY、DAC等众多元器件。SoC的设计大大提升了芯片整体集成度,大小仅与一元硬币相当。
从与下面这张图上的五麦克风阵列的AI语音模组对比,我们可以看到,KAMINO18确实是非常的高度集成,其将大部分的关键元器件都整合到了SoC当中,外围大幅精简,只需连接MIC即可。
另外,KAMINO18还内置了众多Rokid自研的先进语音交互算法:包括相控阵技术、CTC模型、自定义唤醒词、离线语音指令、低功耗唤醒等算法。
以语音指令为例,其可以实现在没有网络的情况下也可以通过简单的“开灯”、“关灯”、“播放音乐”等不需要网络的指令来操纵智能家居。据介绍,Rokid的研发人员还在持续开发基于Kamino18的新的AI功能,如离线语音合成、离线声纹识别等,来充分发挥此芯片的威力。预计7月声纹识别功能就会上线。
而KAMINO18当中最核心的部分就是NPU,其可以同时对不同的算法模型进行加速运算,并且可以并行处理不同模型。还可支持通过软件来进行扩展,支持TensorFlow等。
内置的DSP,可以对回声消除、自动增音控制、降噪等复杂的音频算法进行处理。同时SoC还支持6 MIC阵列、I2S、PDM等输入。从硬件上来说这颗芯片能够满足绝大多数场景下智能语音设备对硬件的要求。
在性能方面,据Rokid北京AI-Lab负责人高鹏博士介绍介绍,KAMINO18能够保持在提高性能的同时功耗降低50%以上,同时集成度也可以提高30%以上,成本也可以降低30%以上。在复杂场景下的性能表现也得了极大的提升,并能够支持更多的离线功能。
高鹏博士非常自豪的表示:“如果要给Kamino 18下一个定义的话,那么可以说这是一颗全能之作的芯片,它内置了全部的语音AI算法功能,并具有高性能、高集成度、低功耗和低成本的明显优势。”
另外,针对海外市场,KAMINO18也即将支持Amazon Alexa。据Misa介绍,未来基于KAMINO18的智能语音设备可以同时支持Rokid的中文语音服务和亚马逊Alexa的英文语音服务。当用户用英文交流时就会连接亚马逊服务,当用户用中文交流的时就会连接Rokid的服务。
与杭州国芯的合作
不过,值得注意的是,KAMINO18是由Rokid和杭州国芯合作完成的。
去年10月,杭州国芯就曾在深圳发布了两款语音AI芯片GX8010和GX8008。那么此次Rokid的KAMINO18是否就是采用的其中的一款芯片呢?
在随后的专访环节,Rokid创始人兼CEO Misa则表示KAMINO18是由杭州国芯为Rokid定制的。
🔺Rokid创始人兼CEO Misa
Misa解释称:“我们今天的芯片跟过去理解的芯片不大一样,今天基本是SoC,而SoC里边有90%的东西都是很成熟的,Rokid没有必要花精力去做各类IP,所以我们关注的则是如何利用现有的IP来进行组合,如何融入Rokid的算法,如何在SoC架构层面进行优化等等。Rokid跟国芯的合作,我们是从OS层面到整个算法层面,一直到指令集,到优化层面,全部由Rokid提供,来帮助做的。”
那么Rokid的KAMINO18与云知声的AI芯片雨燕(Swift)又有何不同之处呢?
Misa表示:“与其他语音AI芯片相比,Rokid的这款芯片最大的区别是,我们是一个完整的系统级解决方案,Rokid的芯片必须能够保证跑一个完整的OS,将所有的内容都可以完整的跑起来,所以它一定是非常强大的。比如云知声的AI芯片更偏向控制,而我们更偏向AI,所以我们的芯片是一个完整的东西,不简单只是一个语音的信号处理,而是能够处理一些复杂逻辑,包括用户的体验等诸多的东西。因为我们的产品是高度复杂交互性的产品,所以我们要做更强大的芯片,面向的场景也不同。目前高集成度、高性能的语音AI芯片的只有我们,其他大多是做非常前端的。”
做一个“分享者”
过去很多人认为Rokid是一家做智能音箱的公司,而此次KAMINO18的推出,又使得不少人认为Rokid将会成为一家AI芯片公司。但是实际上,Rokid是想通过AI芯片将自己的能力“分享”出去,做一个“分享者”。
“Rokid从第一天起就不是一个智能音箱公司,我们现在也不是芯片公司,只不过芯片会成为我们非常有竞争力的元素。”Misa认为:“Rokid是一个探索者,我们一直在不遗余力地做探索,我们希望将该趟的坑、该冒的险,通过自己来落地,而不是将这种风险转递给合作伙伴。当我们完成探索和完成自己的认证之后,Rokid的分享者的角色就开始产生,我们会将对产品的理解、对技术的理解,对用户的理解、对市场的理解以及对整个行业和生态的理解分享给合作伙伴。而打造AI芯片则使得我们具备了能够提供一整套的解决方案的能力。”
正因为Rokid希望做一个“分享者”,所以在这款AI芯片的商业模式上,也不同于其他的AI芯片厂商。
在专访环节,Misa也明确的表示:“Rokid不通过芯片赚钱,甚至我们都不直接单独卖芯片,Rokid做芯片也不是以做芯片为出发点的,因为对我们来讲,做行业的人都知道芯片的利润特别低,只是因为市面上没有我们需要的,所以我们来做,如果市面上有我就用它。另外,我们也不卖模组,因为KAMINO18是高度集成的,没有模组,只有少数外围器件。我们是给用户提供一整套的解决方案。当然,客户也可以根据自己的需要进行选择。我们会给大家充分的想象力跟自由度去打造自己的产品,这就是Rokid。”
KAMINO18已拿下百万颗订单
衡量一块芯片成功与否的标准是看它能否大规模的应用于产品。据介绍,Rokid Me的量产版就将会搭载KAMINO18。
另外,据高鹏博士透露,KAMINO18在尚未出货的情况下,就已经获得了行业内其他合作伙伴的认可和一定规模商业合作。
在当天的发布会上,喜马拉雅FM副总裁李海波先生也宣布了与Rokid的深度合作,双方将合作基于KAMINO18打造一款儿童音箱——晓雅mini。
除了与喜马拉雅的合作之外,在会后的专访环节,Misa还透露Rokid很快将会与NXP达成合作,不过具体合作内容,Misa并未透露,笔者猜测可能是在AI芯片方面的合作。
而更为惊人的是,KAMINO18目前已经拿到了百万片的订单。
“Rokid的芯片是量产型的,而不是只表现在PPT上的。”Misa非常自豪的表示:“我们的KAMINO18已经定下的就有超过几百万片了,所以大家完全不用担心客户方面的问题。”另外,Misa还透露未来Rokid的AI芯片还会加入机器视觉方面的能力。
最后,Misa强调:“Rokid不是一家做智能音箱的公司,而是人机交互技术公司。我们在北京、美国设立研发团队,所有的研究都围绕未来人机交互的环节。我们的核心目的是探索新的交互方式和交互体验。当然,人机交互最重要的一个环节就是AI,所以我们会用AI技术来做人机交互的探索。”
作者:芯智讯-浪客剑