给您最好的
阿里云优惠券!

【新刊】科大讯飞:让世界听见中国的声音 ——专访科大讯飞华南人工智能研究院执行院长刘舒

科大讯飞股份有限公司是目前亚太地区最大的智能语音和人工智能上市公司。成立于1999年的科大讯飞,专注从事智能语音及语言技术、人工智能技术研究和语音信息服务及电子政务系统集成20年,以令世人折服的语音识别、语音合成等技术,让全世界感受到了来自中国的最强AI声音。

当今世界,主要发达国家都把发展人工智能作为提升国家竞争力、维护国家安全的重大战略,加紧出台人工智能的规划和政策,围绕核心技术、顶尖人才、标准规范等强化部署,力图在新一轮国际科技竞争中掌握主导权。成立于上世纪90年代末的科大讯飞,专注智能语音及语言技术、人工智能技术的研究20年,从默默无闻到声名鹊起,这家纯粹由科学家创立驱动的科技企业,在中国科技大学几名信号处理专业博士生的带领下,经过二十载砥砺创新,成为当今语音识别人工智能领域的全球顶尖企业。在国内,它与百度、腾讯、阿里云一起,成为中国人工智能产业的开路先锋和领导者。在国际舞台上,它更是凭借雄厚的技术实力,与亚马逊、谷歌、Facebook等全球知名企业同台较量,成为语音识别人工智能领域的翘楚。近期,本刊记者专程赴科大讯飞华南总部,采访了科大讯飞华南人工智能研究院执行院长、广州讯飞易听说总经理刘舒先生,对科大讯飞在广东开展的人工智能技术创新活动进行了探访。

《广东科技》:请您首先给大家科普一下人工智能的相关知识?

刘舒:人工智能分为三个阶段,分别是计算智能、感知智能和认知智能。计算智能就是计算机能存会算,有了互联网、云计算后,计算机在计算能力上早已超过人类。目前像阿里云、亚马逊等企业,都是提供强大运算能力的企业。光有强大的计算能力,还称不上完全的人工智能。在计算之上的第二个阶段是感知智能,它让机器具备视觉和听觉等能力。如今最常见的语音识别、图像识别就包含感知智能技术。目前,人类在感知智能上已取得很大突破,像语音识别的准确率已达到99%,图像的人脸识别准确率也达到95%以上,这些技术在很多领域都得到应用。在感知之上,就是人工智能的最高阶段认知智能,它是与人的语言、知识、逻辑相关的智能。其目标是让机器掌握人类的语言和知识体系,并像人一样会思考,能真正理解其内在逻辑。目前在认知智能这一阶段,无论是学术研究还是实践应用,中美两国都是位居世界前列的。作为前沿科学的认知智能当前还处于不断研发探索中,如能取得重大突破,那么它将运用到我们生活的方方面面,届时,人工智能将会迎来全面爆发。

广州市委常委、南沙区委书记蔡朝林、科大讯飞董事长刘庆峰视察位于南沙中心医院的科大讯飞-人工智能医学影像诊断中心

载誉无数 技术响当当

《广东科技》:科大讯飞作为语音识别人工智能领导企业,你们的优势是什么?

刘舒:去年年底,科技部召开“新一代人工智能发展规划暨重大科技项目启动会”,会上宣布了4个国家新一代人工智能平台,其中,智能语音开放创新平台就是依托我们科大讯飞来建设的。在这场抢占人工智能制高点的战斗中,科大讯飞能够与百度、阿里云、腾讯一起肩负国家委托的重任,成为中国人工智能产业的开路先锋,凭借的正是我们在语音识别方面的绝对领先优势。

从1999年科大讯飞创立至今,我们就不断在语音识别领域研发创新。目前,我们在语音合成、语音识别、口语评测、自然语言理解、图像识别等方面已占据世界领先地位。我举几个例子,你就会了解得更清晰一些。国际上有一个“暴风雪竞赛”(BlizzardChallenge),是业内最高水平的语音合成比赛。我们从2006年参赛至今,已连续12年蝉联第一名,并且7项指标全部位列全球第一。而在另一项国际重大赛事——国际多通道语音分离和识别大赛(CHiME)中,我们也在2016年获得第一名。

科大讯飞的翻译机产品

《广东科技》:参加这些比赛的都是一些什么机构呢?

刘舒:参加这些比赛的选手,都是来自麻省理工、斯坦福、微软、亚马逊、Google等世界知名大学、科研机构与企业的专业研发团队。可以说,与我们较量的都是全球顶尖的高手。

此外,我们还在2017年国际医学影像领域的权威评测LUNA中,以显著优势获得该项评测的第一名并刷新世界记录;在2017年国际自动驾驶领域权威评测集Cityscapes中,我们以平均81.4%的精度取得该项评测第一名,同样刷新了世界记录。

《广东科技》:你们在语音识别、语音合成方面获得了这么多奖项,表明你们的技术确实胜人一筹。那在这些技术的具体应用上你们主要解决了哪些实际问题呢?

刘舒:一直以来,我们科大讯飞都在致力将语音识别技术应用到具体行业中,为社会民生解决实际问题。经过这些年的努力,我们很好地实现了这一目标。我举几个比较典型的应用吧:

一是在教育领域,从2014年至今,我们为广东高考的英语口语考试提供了自动评测技术,由机器人对考生的口语内容进行评分。此举有效解决了传统口语考试中人工评测组织难度大、成本高、效率低、公平性难以保证等问题。由于效果出众,目前,全国60多个地市的中考也在使用我们的这个技术。

二是在司法领域,科大讯飞研发了全球首个刑事案件智能辅助办案系统,该系统可全面应用到侦查、批捕、审查、审判等各个环节,提高办案效率。另外,我们开发的听见会议系统,为法院开庭审理案件提供了现场语音自动识别技术,通过声纹来识别法庭现场的不同角色,从而结构化地记录和实时转化现场声音,保证了庭审现场记录的高完整度和低错误率。目前,听见会议系统在国内许多地方的中级人民法院和基层法院都有运用。

三是在医疗领域,我们通过智能语音交互技术减轻了医生的文书压力。我们为牙科、放射科以及住院部的医生提供了语音电子病历。以前,医生在给病人做手术或巡查病房时,需要配备专门的助手来记录现场诊断和治疗的情况,语音电子病历的推出则能够准确记录医生现场的诊断情况,事后还可以帮助医生结构化地整理出病历内容。

科大讯飞”智医助理“机器人是全球首个通过国家医师资格考试测试的机器人

《广东科技》:听了您的介绍,感到人工智能确实在极大地改变着我们生活的方方面面。前不久,科大讯飞在南沙成立了华南人工智能产业研究院,请介绍一下这个研究院的相关情况。

刘舒:人工智能的发展必须与当地的行业及数据深度结合。华南地区是我国重要的经济和人口活跃区,科大讯飞非常重视这一地区的业务发展,2015年,我们专门成立了科大讯飞华南有限公司。这是科大讯飞落地广东的一家本地化企业,专门负责承载华南地区总部管理职能,同时,它还承担科大讯飞在华南地区的研发、销售、交付以及创新项目孵化等重要职责。

地处粤港澳大湾区中心的南沙,地理位置优越,又是国家自贸试验区,享有国家的相关政策优惠。目前,南沙正在打造国际人工智能产业示范区。为吸引人工智能企业入驻,南沙提供了一系列优惠条件,包括针对人工智能人才和企业的补贴。更重要的,南沙还开放了一系列的政务数据,如医疗、教育、司法等领域的数据。这就让我们能够用语音识别技术帮助当地政府提高他们的政务能力。

在这样的大背景下,我们在南沙设立了产业研究院,目的之一是招揽大湾区以及海外的科学家,在南沙开展核心的人工智能研究。其二是在研究院内对华南地区的具体行业应用项目进行孵化,通过孵化出好的服务和产品,将科大讯飞的技术融入到整体的行业中去。

科大讯飞华南人工智能研究院及相关校企联合实验室在南沙挂牌成立

同场竞技 中国无惧PK

《广东科技》:接下来请您结合企业自身发展情况,谈谈我国在人工智能产业发展上的优势和劣势?

刘舒:先谈谈我们的劣势吧。我们知道,人工智能是建立在互联网、大数据的基础之上的,也就是有了这些作为基础,人工智能才能实现。早在上世纪六七十年代,美国就开始互联网的研究和应用。相比美国,中国的劣势就是在互联网方面起步晚,因而在人工智能相关的人才、资源的储备上,我们的短板很明显,美国则具有先发优势。以人工智能论文数量为例,在全球发表的人工智能方面的论文中,美国占了60%,位居全球第一;中国虽然位列第二,但只有15%。

当然,我们中国也有自己的优势。人工智能发展至今大致上经历了三次浪潮,前两次浪潮因为计算能力、存储设备、网络环境等各种原因,人工智能没能发展起来。而第三次浪潮,也就是从本世纪初至今的这一波浪潮,随着深度学习算法加上云计算、大数据等广泛应用于图像识别、语音识别、生物识别等多个技术方向,并达到工业界可应用的程度,人工智能的各种应用开始白热化起来。在人工智能的应用上,我们和美国几乎是处于同一起跑线上,但我们有两大突出优势。要知道,发展人工智能最核心的是要有数据,我们中国由于人口基数大、各行业应用广泛,因而有着巨大的数据基础和产业基础,这对人工智能的发展至关重要。还有一点,就是咱们中国人勤奋、吃苦耐劳,所以,通过一定的时间努力,我们一定可以在人工智能的发展上领先美国。

2017广州《财富》全球论坛晚宴上,科大讯飞“晓曼”机器人“讲述”广州创新故事

数据“喂养” 壮大AI产业

《广东科技》:当前,人工智能产业的发展已上升至国家层面,如何又快又好地推动人工智能产业发展,您有哪些个人建议?

刘舒:我觉得推动人工智能的发展离不开三件事。首先是产业人才的集聚。一个产业的发展需要人才,特别是一些“新鲜”的人才,如归国创业的海归群体、刚刚在行业崭露头角的新人,等等。但目前在北上广等产业集聚地创新创业时,会面临高房价、高生活成本等压力。如何为这些产业亟需的人才提供切实的帮助,是产业发展的根本。我建议政府可以有针对性地出台税费减免或补贴的政策,如广州南沙区,就对认定的各类人工智能人才给以相应补贴,让这些人愿意在南沙从事人工智能的相关工作,从而为产业发展输入了源源活水。

二是要加大数据的“喂养”。因为人工智能的发展不能脱离数据而存在,只有在大量数据基础上,机器才能通过学习作出智能性判断和预测。在具体行业应用中,基础数据越丰富,使用的人越多,机器就会越准确。人工智能就是以这样的方式,将前人的知识精华继承并发扬下去。因此,推动人工智能产业的发展,需要政府部门开放一些关乎社会民生的大数据,如教育、医疗等方面的数据,与我们人工智能企业共同合作,解决社会民生中的实际问题,让百姓的生活更加便利和高效。

三是推动人工智能产业的发展,一定要把人工智能企业研发出来的东西应用到具体的业务流程中去,真正解决实践中发现的各类问题,不断提高工作的效率和生活的便利,而不是做一些形象工程或展示项目。作为人工智能企业,我们也需要通过与具体行业的紧密联合,不断迭代升级我们的产品和技术,让机器不断学习、不断校正,从而促进人工智能不断创新发展。

展示广东科技的力量

主管:广东省科学技术厅

主办:广东省科学技术情报研究所