国际著名人工智能专家李海洲博士 (IEEE Fellow) 加盟快商通任首席科学家

近日,厦门快商通科技股份有限公司宣布:国际语音通信学会 (ISCA) 首位华人主席李海洲教授正式加盟快商通,担任快商通首席科学家,全面指导快商通新加坡人工智能研究院,加快商通人工智能产业落地,助力厦门打造具有国际竞争力的人工智能产业发展,做高科技技术创新和发展的开创者。

李海洲教授现任新加坡国立大学电气与计算机工程系终身教授,同时也是澳大利亚新南威尔士大学教授、国际语音通信学会 (ISCA) 首位华人主席、亚洲自然语言处理协会 (AFNLP) 主席、亚太信号与信息处理学会(APSIPA)主席、美国电气与电子工程师学会(IEEE)音频、语音、和语言处理汇刊总编。

李海洲教授在国际期刊上已发表了 500 余篇技术论文和学术论文,并多次获最佳论文奖。研究方向包括说话人识别,人声分离,语音识别、语音分析处理,信息检索机器学习数字信号处理等多个领域。研究成果自 2008 年起在美国国家标准与科技局年度评测中名列前茅。

快商通董事长肖龙源表示,李海洲教授是国际上最具影响力的人工智能语音领域研究者之一,对语音事业有着卓越的贡献。他有着非凡的智慧和创造力,能够与他合作,我们感到十分的荣幸,这是快商通人工智能战略发展过程中一件具有重大意义的事情。

在加入快商通之前,李海洲教授曾受邀担任苹果电脑新加坡研究中心语音处理实验室研究主任,曾作为首任研究主任联合创办了百度-新加坡资讯通信研究院联合实验室,李海洲教授在 1994 年曾加入法国国家科学研究中心 (CNRS) 任研究员,从事语音识别的研究,并开始涉猎声纹识别,是国际上最早从事声纹识别技术研究的学者之一,曾提出无监督声学建模算法、语音质量的感性评价方法等开创性研究成果。

2001 年,李海洲教授率先研发出多语种语音自动问答系统并在新加坡樟宜机场投入使用,此项工程于 2002 年荣获新加坡国家资讯通信奖。2012 年他带领团队研发出全球首款声纹解锁智能手机「联想百度云手机 A586」,此项技术获颁 2013 新加坡工程院杰出工程成就奖。2013 年,再次携手百度,为全球最大的中文音乐搜索平台「百度音乐」开发了「听歌识曲」功能,帮助手机用户轻松识别周围正在播放的歌曲,每天服务全球用户数以百万计。为表彰他在语音领域的杰出贡献,李海洲教授 2009 年获诺基亚基金会颁发诺基亚教授荣誉,2013 获颁新加坡总统科技奖,2014 获颁美国电器与电机工程师协会会士(IEEE Fellow)荣誉。目前,李教授在新加坡领导着 50 多人的技术团队,从事深度学习和智能语音的研究。

签约仪式上,肖龙源指出:「成为科技强国首先要有人才,有了人才之后,把学术界研究成果和工业界发展结合,找到合适的场景深耕,发现其中需要解决的本质问题,和最优秀的科学家解决这些问题,让我们研究的算法具有普适性、通用性,才能让人才在合适的方式和合作模式上影响工业界,进而影响人工智能产业的发展。李海洲教授加盟快商通任首席科学家,是快商通全面转型升级的关键一步,将进一步实现其下一阶段成长的战略,势必将激发出更多的 AI 潜力。另一方面,这项任命显示了快商通在人工智能领域发展的投入和决心,未来,快商通将专注于声纹识别及智能语音领域的孵化和探索,将学术上的研究成果应用到工业界,让技术真正服务于人类」。

「以产品和技术服务 30 亿人」为愿景,快商通在 2013 年开始进行声纹识别及人工智能相关技术研发。2016 年初,其声纹识别技术在 10 亿级别规模的声纹库检索中达到 80% 首选识别率,领先于业内水平。近年来,快商通不断深挖细分场景下的用户需求,陆续针对金融、安防、能源、公安司法、企业管理等领域推出专属定制的解决方案。目前,快商通已服务了平安集团、国家电网、南方航空、厦门市公安局安等数十家大型金融企业和机构。

产业语音处理人工智能研究院声纹识别
1
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

信息检索技术

信息检索(IR)是基于用于查询检索信息的任务。流行的信息检索模型包括布尔模型、向量空间模型、概率模型和语言模型。信息检索最典型和最常见的应用是搜索引擎。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

数字信号处理技术

数字信号处理(digital signal processing),简称DSP,是指用数学和数字计算来解决问题。 大学里,数字信号处理常指用数字表示和解决问题的理论和技巧;而DSP也是数字信号处理器(digital signal processor)的简称,是一种可编程计算机芯片,常指用数字表示和解决问题的技术和芯片。

说话人识别技术

说话人识别作为模式识别的一类,主要任务是通过待测试语音来判断对应的说话人身份。 从识别对象进行划分可以主要分为两个部分:说话人确认(speaker verification)和说话人辨认(speaker identification)。如果待测说话人的范围已知,需要通过语音段对待测说话人的身份进行判断,是否是属于某个说话人,则为说话人确认。说话人确认问题可以归结为是一种1:1的身份判别问题。若说话人的身份范围未知,需要从一定的范围内来对语音段对应的说话人身份进行辨别,这属于说话人辨认问题。说话人辨认问题可以归结为是1:N的问题。 从识别语音段的文本,可以讲说话人识别问题分为文本相关问题和文本无关问题。对于文本相关问题,待测试语音段的内容需要和系统中预先登记的内容相同。对于文本无关问题,待测试语音段的内容可以与系统中预先登记的内容不同,待测试说话人可以只说几个字来进行身份认证。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

问答系统技术

问答系统是未来自然语言处理的明日之星。问答系统外部的行为上来看,其与目前主流资讯检索技术有两点不同:首先是查询方式为完整而口语化的问句,再来则是其回传的为高精准度网页结果或明确的答案字串。以Ask Jeeves为例,使用者不需要思考该使用什么样的问法才能够得到理想的答案,只需要用口语化的方式直接提问如“请问谁是美国总统?”即可。而系统在了解使用者问句后,会非常清楚地回答“奥巴马是美国总统”。面对这种系统,使用者不需要费心去一一检视搜索引擎回传的网页,对于资讯检索的效率与资讯的普及都有很大帮助。从系统内部来看,问答系统使用了大量有别于传统资讯检索系统自然语言处理技术,如自然语言剖析(Natural Language Parsing)、问题分类(Question Classification)、专名辨识(Named Entity Recognition)等等。少数系统甚至会使用复杂的逻辑推理机制,来区隔出需要推理机制才能够区隔出来的答案。在系统所使用的资料上,除了传统资讯检索会使用到的资料外(如字典),问答系统还会使用本体论等语义资料,或者利用网页来增加资料的丰富性。

推荐文章
暂无评论
暂无评论~