科大讯飞一年一度的发布会11月9日在北京国家会议中心举行,科大讯飞董事长刘庆峰、科大讯飞轮值总裁吴晓如、科大讯飞执行总裁胡郁先后出场,发布了其在教育、客服、医疗等领域在内的十款新工具,并对讯飞输入法、晓译翻译机等产品进行了升级。其中,胡郁在会上演示的脑电波控制智能家居黑科技最吸引眼球。
人工智能的三级推进体系
刘庆峰在演讲中提到,人工智能的发展,核心技术进展决定了产业进程,所以我们必须看看到底今天核心技术能做什么,这也是本场发布会的主题“顶天”的含义。
他认为,人工智能有一个“三级推进体系”,第一级就是各种基础算法,深度学习DNN的算法2010年以后在语音识别领域取得了突破。卷积神经网络CNN算法在2012年以后开始在图像识别中取得突破,包括递归神经网络、注意力机制、对抗机制和增强神经网络等等,这些方法开始不断地在机器翻译、无人驾驶、医疗等领域取得突破。这是基础算法,大家在各个领域进行突破和创新。而在创新的基础上最终展现出来的集成技术成果,主要可以分为感知、理解和推理这三个层次。
基于这些基础算法的创新,通过感知智能,就可以把各种原始数据进行分析和处理,变成有效的信息。
第二步,变成有效信息之后,再通过人工智能的理解能力,把有效信息变成结构化的知识。下一步的学习、训练和推理就以这些结构化的知识为基础。这时,推理的模块再进行决策,无论是用机器下围棋、教育,还是在司法、医疗等领域。有了感知、理解和推理这三层之后——基础算法是一级推进体系,技术体系是二级推进体系——我们就可以把人工智能推进社会生活的各行各业。中国的科研机构,包括科大讯飞在内,已经有很多算法的创新。
2017年,国际语音合成比赛中新增加了无监督的机器学习任务,结果科大讯飞不仅是全球第一,而且和第二名的差距很大,与传统方法也拉开了差距。刘庆峰说,这充分证明了他们在机器的自主学习方面取得了全球瞩目的成果。
他表示,这个技术未来有潜力应用于全世界各个新的语种上,只要获得适当的语调,机器自主就可以学习训练,生成某一个语言的语音合成,甚至一个小语种的语音合成。
强势进军医疗领域,智医助理通过临床执业医师考试
刘庆峰首先揭开了本场发布会的第一个惊喜:讯飞的智医助手刚刚以456分(总分600,分数线360)的高分通过了2017国家临床执业医生考试,在安徽超过两万名考生中排名前100。他说:“这是一个可以载入中国甚至全球人工智能史册的好成果。”
讯飞智医助理的456分如何炼成?
刘庆峰在发布会上详细地介绍了这一成就背后的原理:
首先,医学考试的一个难点在于所有的考题必须是保密的,不可能和原来的数据库重复。所以就涉及到机器学习推理的部分。要做好这样一个推理,首先必须要对海量的医学知识进行学习。另外就是,这些考题都是选择题。
科大讯飞与人民卫生出版社合作,把所有医学专业的学生应该学的 53 本教科书全部学习,而且学习了最前沿的国际论文,还学习了大量的案例。但是学完之后,怎么能够把它表达出来?传统的搜索根本没法做。一般意义上的知识图谱也很难表达这么复杂的信息。
科大讯飞的语义张量的模式是一个创新,仅仅原有知识的学习和沉淀还不够,所以需要自然语言理解发挥作用。理解完以后,在各个选项中怎么进行选择?这需要通过语义证据抽取,而且进行多尺度的推理,包括关键点的推理、上下文相关的推理以及关于证据链的推理等等一系列复杂的动作。
科大讯飞此次强势进军AI医疗领域,并在现场发布了三款医疗工具,分别是语音病例录入、医学影像辅助诊断系统以及智医助理。其中医学影像辅助诊断系统支持肺部CT、乳腺、心电图等医学影像诊断,诊断效率可以达到每秒1例。
智医助理建立在科大讯飞的人工智能辅助诊疗平台,科大讯飞董事长刘庆峰称,智医助理在国家临床临床执业医师考试中得到456分的成绩,超过360分的医师资格分数线。
除此之外,科大讯飞还发布了针对客服领域的工具智能客服2.0,包含两个产品,一个是全语音门户,科大讯飞认为未来3年按键式电话服务将会被全语音门户替代。第二个产品是智能客服助手,可以提供话前用户需求预测,话中辅助推荐与营销,话后实时总结。
刘庆峰称,人工智能将替代目前很多的岗位工作,比如电话推销员、打字员、会计、房产经纪、银行职员、前台等,这些岗位都会大面积地被AI取代。
夯实教育行业,发布五款AI辅助教学工具
科大讯飞在教育领域已经深耕很多年,此次发布的教育系列产品涉及微课录制、课堂互动、作业批改、组卷、个性化学习方案等多个教学环节。
首先发布的是智慧微课工具1.0,可以随时进行课堂教学过程的录制,生成指导教学的课件资源。这套工具由科大讯飞研发的智能麦克风、智慧微课服务器两部分组成,不仅可以便捷的录制课堂内容,还可以将声音转为文字,将课件结构化,与PPT实现动态同步。另外,通过对录制的内容语义分析,还可以标记关键重点信息,完成后可以一键分享。
其次是智慧纸笔课堂1.0,对学生的纸币书写进行智能识别,现场智能批阅,实现课堂实时互动教学。科大讯飞轮值总裁吴晓如称,智慧纸笔课堂1.0支持100个学生同时使用,手写识别准确率大于97%,续航时间大于7天。
第三款产品是智慧作业平台1.0,主要用于智能快速批改作业,互动反馈。第四款产品是智慧组卷工具1.0,通过对知识点分析,这款工具可以在3分钟内完成组卷工作,而且试题匹配度大于96%。
第五款产品是升级的智学2.0工具,据吴晓如介绍,智学工具目前已经在全国1万多所学校应用,采集了350亿测评数据。而智学2.0版升级构建学科知识图谱,可以对学生进行更加个性化的学习分析。
据悉,以上五个工具将于12月份首发。据科大讯飞董事长刘庆峰介绍,科大讯飞利用人工智能和教育想结合,促进教育升级,已经与1.2万所学校合作,其中有68所百强学校。
移动和翻译领域:升级讯飞输入法和晓译翻译机
讯飞输入法在此次发布会上进行了升级,支持对个人用户的声学模型、语言模型进行个性化设置,比如支持语音修改输入的文字,并对这种修改关联个人声学模型进行记录,以达到个性化准确输入。据胡郁介绍,讯飞输入法已经积累了5亿用户,目前月有1.2亿活跃用户,支持22中方言识别,通用场景的语音识别准确率达到了98%。
2016年的科大讯飞发布会上推出的“晓译翻译机”,现在已经成为讯飞的“明星产品”,卖到脱销。
胡郁介绍说,基于售出去的20万台翻译机和超过1亿次的翻译请求深度分析,他们发现其实用户还有三个非常重要的痛点:第一,信号不稳定;第二,多语言要求;第三,国外的安全保障和紧急联络。
所以,科大讯飞推出了讯飞晓译翻译机1.0plus系统,支持离线翻译,支持的外文语言增加到5种,增加了一键求助功能。
除此之外,科大讯飞还发布了偏向儿童的英语学习产品译呗,不仅支持常用英语翻译,还内置了跟读学习,实时反馈等功能。
随后,胡郁还发布了科大讯飞“译呗”,这是一个面向外语学习者的软硬件一体化产品。
胡郁介绍说,科大讯飞的“阿尔法蛋”和系列产品是今年的中国智能玩具的销量冠军。除了Alpha蛋以外,最近马上还要推出“英语蛋”和“黄金蛋”。讯飞最新的AIUI2.0平台、输入法最新功能和车载飞鱼2.0的系统也在发布会上露面。
科大讯飞执行总裁胡郁在现场还展示了利用讯飞机器人产品Alpha英语蛋与外国友人交流的情况,Alpha英语蛋可以利用语音合成模拟说话的声音,将翻译内容输出为语音合成后的效果。胡郁在现场表示,未来的翻译场景,应该能够达到全双工,语种自适应,以及语音个性化的程度。
胡郁在演讲中还提别提到:“当今世界已经不是一个公司单打独斗的时候了,那么我们都在讲一个词叫什么?生态系统,也就是说讯飞开发者,其他的公司最终的消费者,我们其实是在一个生态里面,我们是在一个共同的生态圈里面来看,公司如何获得收益,消费者如何获得好的产品,而我们的开发者能够获得他们的乐趣。”
面向车载和家庭场景:发布飞鱼2.0和魔飞麦克风系统
科大讯飞还发布了面向车载的飞鱼2.0系统,可以收集用户数据进行分析,了解其喜好与习惯,达到在与用户沟通时能够主动发问的程度。
科大讯飞还发布了面向家庭环境的魔飞麦克风系统,可以利用语音、手势、用户形体等多模态进行控制,此外,现场还展示了利用脑电波以及声纹识别控制家电的先进技术。
据刘庆峰现场公布的数据,讯飞开放平台AIUI,目前已经有46.5万开发者团队,累积终端数超过15亿,日均交互次数40亿。刘庆峰称,科大讯飞的愿景是希望未来每个人都有AI助手,就像目前每个人都有手机一样,但要实现这一目标,需要无监督训练、个性化学习、低成本运算三个条件成熟,这是一个充满挑战的历史进程。
胡郁现场演示讯飞黑科技:用脑电波控制智能家居
科大讯飞执行总裁胡郁在发布会现场与产品经理康宏一起展示了本场发布会最吸引人眼球的黑科技技术:脑电波。
这一用脑电波控制家电的技术由华南理工大学讯飞联合实验室开发。佩戴上头盔和特制外套的演示者在接受到信息,比如“打开电灯”后,只需要保持对着墙壁全神贯注地思考,就能控制电灯,并且系统会提示“电灯已打开”。
新智元智库专家、talkingBrain联合创始人兼CEO林思恩对新智元介绍说,这一技术的原理主要是脑电波经认知解码后的信号转换、输出和传输,通过SDK可以一站式解决脑电对终端设备的控制。
“脑电波控制家电”是科大讯飞对智能家居除了语音以外的解决方案的探索,也是胡郁在现场所提到的“多模态交互”上的探索,这里的多模态技术包括:语音识别、云端指令集、多模数据处理、自然语言处理、手势识别、图像识别、声纹识别、OCR、触屏意图解析等等。
稿源:网易科技、新智元