你知道吗?中国多项AI技术全球第一

人民日报客户端

完胜世界围棋冠军的AlphaGo、AlphaGo Zero,可能让一些人产生错觉:在人工智能(AI)时代,中国又落后了。

事实并非如此。在日前举行的科大讯飞2017年度发布会上,董事长刘庆峰信手拈来,剧透了多项领先世界的AI绝技。

许多人可能不知道,在《MIT科技评论》评选的“2017全球50大最具科技创新力企业”中,科大讯飞排名第六。

许多人可能更想不到:这些刷新世界记录的技术不仅包括科大讯飞的看家本领——语音合成与语音识别,还包括其它你想不到的黑科技。随着这些技术的应用落地,中国人将优先享用到人工智能时代的创新福利。

语音智能:语音合成第十二次蝉联世界第一,语音识别率提高到98%

众所周知,人类90%的信息输出依靠语言,让计算机“能听会说”是人工智能的重要目标,实现这一目标的前提就是发达的语音识别与合成技术。语音合成与识别一直是科大讯飞的看家本领,近些年该公司不断创新,在语音合成与识别上更上层楼。

先看语音合成。暴风雪竞赛(Blizzard Challenge)是国际最权威的语音合成比赛。科大讯飞不仅以语音合成技术率先超过4.0分的成绩连续12年蝉联全球第一名,而且依然是全世界唯一能让语音合成技术能够达到真人说话水平的。

语音合成技术率先超过4.0分是什么概念?“5.0分是播音员,4.0分代表美国普通老百姓的发音水平。“科大讯飞的语音合成得了4.0分,说明中国人做的计算机可以像美国人一样念英语——迄今为止,只有中国人能达到真人的水平。”

“不仅如此,今年暴风雪竞赛新添了一个项目——无监督的机器学习,科大讯飞不仅是全球第一,而且和第二名的差距比传统方法的差距更大。”刘庆峰说:“这充分证明了:我们在机器的自主学习方面取得了全球瞩目的成果。”

再看语音识别。今年,在讯飞语音输入法中,科大讯飞的语音识别准确率提升到98%。要知道,98%是每月1.2亿活跃用户的平均准确率——其水平之高,可以想见。

世界领先的语音合成与识别技术,除了能帮助人们实现语音输入、语言互译,还可以重现、保存人类方言——目前世界上现存约6000种方言,而平均每两周就有一种方言消失!

“为让更多的社会人群都能使用人工智能技术的福利,我们在2017年进一步大幅提升的方言识别的水平。”刘庆峰介绍说,现在科大讯飞的方言识别已经有22种,是全世界唯一能够做多种方言识别的核心技术厂商。“在中国方言识别方面,我们的相对指标比2016年提升了50%以上,现在方言识别准确率超过90%的已经接近十种,包括粤语、四川话、东北话、河南话、天津话、山东话、贵州话、宁夏话等。我们还将在22种方言中不断拓展,实现真正的语言沟通无障碍。”

图文识别:英文手写识别准确率全世界排名第一

除了语音,语言文字识别也是科大讯飞的绝技。2015、2016年,科大讯飞利用人工智能技术,不仅可以把学生手写内容自动识别转为电子内容,还使得机器在英语和语文的作文评分上可以超过一般老师的评价水平。

“2017年,科大讯飞英文手写识别准确率由去年的92%达到97%,全世界排名第一。对数学题目中的图形识别,准确率达到92%以上。”

刘庆峰表示,“将来我们可以读任何相关信息,使得学生回到家里的作业的个性化数据采集成为可能,从而帮助老师可以实时、准确地了解每一个学生的学习状况。”

教育学习为AI应用的一大重点领域。刘庆峰介绍少,科大讯飞的教育学习类智能产品能帮助老师迅速完成对学生学习成果的考评,也能根据学生测验情况制定个性化的学习计划等。“把人工智能技术应用到学校中,可以帮助老师更好地因材施教、实现个性化教学。这样就可以把原来大量的无效重复学习省掉,让孩子学得更又针对性、更有趣、更有效率。过去一两年内我们设计的教育AI体系已经推广到一万两千所学校,包括中国百强校中的71所。”

医学影像识别:刷新全球肺结节测试全球记录

医学影像是医生诊断病情的重要依据,影像科医生每天都要看上百张科学影像图片(俗称“看片子”),不仅很累,而且还会出现误诊。

利用人工智能来帮助医生识别医学影像,是科大讯飞近年来开发的新技术。在今年8月举行的全球肺结节测试(针对肺癌肺部结节的测试,名为Luna测试)中,科大讯飞刷新了世界纪录,读片准确率达到94.1%。

“根据科大讯飞在安徽省立医院等三甲医院测试结果,人工智能对肺结节的判断技术已经达到了三甲医院平均医生的水平。”刘庆峰说,今后随着该技术的不断进步,可以帮助医生更快、更准确地读片,从而大幅减轻医生工作强度、提高诊断水平。

图像识别和图像理解:自动驾驶领域权威国际测评刷新世界记录

无人驾驶是目前人工智能技术领域的大热门,也是人类的梦想之一。在快速移动中正确识别、理解汽车周围出现的人、车等,是无人驾驶亟待攻克的技术难关。

“在2017年10月份由奔驰发起的自动驾驶领域权威国际测评Cityscapes中,有包括谷歌在内的44家单位参加,科大讯飞刷新世界纪录,自动驾驶场景分割任务准确率达到81.4%。”刘庆峰说,“FBI最牛特工的人脸识别能力为99%,今后我们将朝着这个目标继续前进。”

阅读理解:国际机器阅读理解比赛超越微软

阅读理解也是人工智能的重要内容。在由斯坦福大学牵头的SQuAD国际机器阅读理解比赛中,有大约10万篇英文文章,机器阅读之后需要回答有关提问,并给出文章出处。“过去两年均由微软摘取第一名,在今年2017年10月举行的SQuAD国际机器阅读理解比赛中,科大讯飞刷新了这项世界纪录,准确率达到86.45%。”

医学推理:讯飞智医助手全球第一个通过国家临床执业医师综合笔试评测

11月6日,科大讯飞研发的人工智能机器人——讯飞智医助手,通过了国家职业医师资格测试,成为全球第一个通过国家医师资格考试的机器人。

通过国家医师资格考试是一个怎样的过程?据刘庆峰介绍,首先必须要对海量的医学知识进行学习,从医学教科书中掌握大量知识,学完之后要表达出来;问题抛出来还要理解,通过语义证据抽取、多尺度的推理,包括关键点、上下文、证据链的推理等一系列复杂环节,才能取得资格考试的通过。

此外,科大讯飞的AI机器人还能完成问诊工作。AI机器人通过语音识别,从医生病人的对话中自动找到关键内容,预判患者可能患了哪几种病,然后比对这几种病的症状与患者的症状,通过人工智能的推理和耦合学习训练,不断对比修订,最终推论出一种病症表现。 “这是一个非常严密的推理过程,容不得半点虚假,绝不是传统意义上的简单搜索能做到。我们要有感知智能,要有语义理解,然后进行推理,才能得到这个结果。AI在越来越多的领域可以学习顶尖专家知识,达到一流专家水平,从而可以超过90%普通专业人士。”刘庆峰表示。

人工智能技术如此了得,将来会不会取代人类的工作岗位?

“人工智肯定会取代许多工作岗位,但这些岗位其实是人们不愿意做的重复性的简单劳动岗位,比如打字员、接线员等。”刘庆峰说,我们要有一个正确的心态,即我们人类不是跟AI去PK,而是站在AI的肩膀上。“比人类更强大的绝不是AI,而是掌握了AI的人类。我们希望未来每个人都拥有自己的AI助手, 就像今天我们每个人都有一部智能手机一样,让AI助手帮助你完成大部分低端工作,你只要做有创意、要决断、需要梦想的事情。让AI助手帮助你、成就你——这就是科大讯飞希望做的事情。”