Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

声与智能来源36Kr 超级观点转载自

熬过技术积累期,智能语音的下一场争夺,是产品和渠道之战

前几天知名风投机构A16Z的Martin Casado和Matt Bornstein对AI的商业模式进行了深度剖析,再次引起了人们对人工智能商业模式的讨论和质疑。自2010年以来,人工智能作为新兴技术的趋势代表,一直在融资市场突飞猛进,常被媒体渲染的无所不能,但若从商业视角来看,人工智能似乎有些名不副实。比如语音领域的科大讯飞和图像领域的旷视科技,公开财报上营收和盈利的压力很大,至于AI芯片和自动驾驶领域目前来看还是融资驱动,比如谷歌旗下的Waymo刚在3月份宣布完成22.5亿美元的融资。

那么,为什么人工智能的商业化过程如此艰难呢?

这是大家非常关注的问题,即便是站在未来看现在,其实也没有准确的答案。但是我们可以从一些资料和数据上进行分析,也可以结合一些实践案例推演,人工智能的核心就是基于数据预测概率,这类概率思路对于我们分析问题还是有些参考价值。

人工智能的商业模式

探讨这个问题之前,我们需要摸底人工智能企业的基本情况,我们根据国内外人工智能排名榜和人工智能知识产权排名榜等调研机构和媒体榜单选取272家全球人工智能企业公开数据进行分析,这些企业也包括了全球上市的企业和互联网科技巨头企业的旗下品牌,并以知识产权为参考剔除了一些概念企业。由于很多人工智能企业还没有上市,因此还不能获取公开财报,但是可以从媒体报道和公司网站上分析出我们所关注的要素即商业模式。我们统计归纳以后得出图1的商业模式示意图,从中可以看出,若把当前的人工智能商业模式归成大类,则主要就是卖技术、卖产品、卖方案和卖服务。

图1:AI企业的商业模式示意通过对这些人工智能企业深入分析发现,76%左右的人工智能企业成立于2010年之后,其中有38%的人工智能企业成立于2015年之后,另外有9%左右的人工智能企业成立在2000年以前,这9%主要是互联网企业及旗下品牌。另外,大约79%的人工智能企业直接切入产品和解决方案,只有9%的人工智能初创企业是从人工智能算法起家,而这些算法也相当分散,涵盖了计算机领域、光学领域、声学领域、电磁学领域、通讯领域、自动化领域等,例如深度学习、图像识别、语音识别、声学处理、语言理解、自动驾驶等,说明每一家算法初创企业都有相应的技术特色。同时我们也发现,从算法切入的人工智能企业基本上诞生在2010年之后。

图2:全球272家人工智能排行榜企业统计通过数据分析,我们发现从算法入局的人工智能公司升级转型的平均年限是5年,转型路径如图3所示,主要转型方向就是AI芯片、AI产品、AI方案和AI系统,其中60%以上的企业全部转型成为了产品和解决方案公司,而有30%左右的人工智能企业则是具有从芯片到解决方案的全部业务。另外,国内的人工智能企业在2015年之后,从算法企业转型为芯片企业的比例较高,而国外从算法公司转型为芯片公司的案例相对较少。

图3:人工智能排行榜算法企业的商业路径上述的现象也得到了资本市场的验证,从图4的2014年-2019年人工智能行业细分领域的融资事件统计来看,我们可以看到大部分资金确实投向了产品和解决方案的应用领域,基础技术领域的投资比例相对较少。这与我们图2的统计分析非常一致,说明资本市场对于基础技术的实际热情并不高,反而是更加关注商业化程度较高的产品和解决方案企业。另外,我们还发现2010年之后的人工智能企业转型方向,与每年的融资热点具有一定的相关性,比如2015年之后人工智能算法企业转型芯片企业就受到了国内半导体产业政策的影响。

图4:2014-2019年的人工智能融资分布 

智能语音的商业探索

从图4可以看出,智能语音技术领域的融资事件最少,从2014年到2019年仅有48项。若从图5艾瑞咨询的数据再次细分为语音识别和语音分析赛道之后,我们发现仅有23家语音识别企业和11家语义分析企业进入到B轮融资。

图5:中国人工智能投资数据概览(数据来源:艾瑞咨询)

从图4和图5的统计分析来看,似乎与我们对于智能语音的直观印象大相径庭,因为智能语音从1956年开始在历史上就备受媒体关注,同时也是全球互联网巨头争夺的主要赛道,这包括了Google、Amazon、Microsoft、Apple、Facebook、Samsung、百度腾讯阿里巴巴等,这些巨头都为此投入了巨资研发或者收购,同时也带动了市场热情。最近十年智能语音的兴起,也是从乔布斯在Apple手机推出Siri开始,随后Amazon和Google引领了智能音箱的欧美风潮,国内的百度、阿里和小米也紧跟其后推出了智能音箱产品并带火了国内市场,直到2019年全球销量超过了1.2亿部(图6)。若单从全球销量这点来说,全球最为成功的人工智能产品其实就是智能音箱,这也是为数不多的能够随手买到并且可以真实体验从人机交互到机器决策效果的产品。

图6:智能音箱的全球销量统计(数据来源:Canalys)为什么人们对于智能语音的感知和实际资本投入有差异呢?

其中关键就是智能语音的技术成熟度和技术链条问题,从图7可以看出,智能语音的关键阶段有三部分:1978年到2011年的起步期、2011年-2016年的发展期和2016年之后的可用期。这其中有两个关键时间节点:一个是2011年语音领域开始应用深度学习技术,并在2016年准确率达到了人类水平,但是这个结果是在理想的数据环境能得到,在真实场景的实用效果还不能满足要求;另外一个就是2016年,其中一个重大的技术进展就是声学与深度学习技术的融合,也就是远场语音交互技术,这解决了机器语音识别在真实环境中的落地应用问题,而代表这项技术的典型应用就是智能音箱,智能音箱在2016年开始在美国爆发,2017年开始在国内爆发。

图7:智能语音的技术历史和技术链条(数据来源:艾瑞咨询)在智能语音技术发展的三个关键阶段中,国内外都诞生了相应的代表公司,比如1999年成立的科大讯飞和2002年成立的中科信利,分别以语音合成语音识别起家;2007年成立的思必驰也是以语音识别起家;2012年成立的云知声出门问问,分别以语音识别和语音助手起家;2016年成立的声智科技,则是以声学为核心的远场语音交互技术起家,并奠定了国内智能音箱的技术路线和特色架构。

国外则有1992年成立的Nuance以语音识别为主,1999年成立的Conexant和2003年成立的DSP Concepts则以声学处理为主,2007年成立的Siri则以语音助手为主。若以融资到B轮之后来算,国外在2010年之后成立并且独立成长起来的智能语音公司相对就很少了,2010年之后国外成立的人工智能企业被并购的情况更为普遍。这其实也说明了由于国内传统行业和高新技术都不如美国成熟发达,反而让国内人工智能创业的机会相对更多一些。补充一下,上述统计分析中并没有包含自然语言理解领域的创业公司,自然语言理解技术相对智能语音技术的发展更慢一些,虽是人工智能技术的“皇冠”,但是一直被认为没有实质突破。图8的数据让我们比较兴奋,由于NTLK(Natural Language Toolkit,自然语言处理工具包)降低了技术门槛,自然语言理解在2019年获得了长足进步,这对于NLP来说或许是一个非常重要的时间节点。从国内的专利申请数量也能验证这点,根据国家工业信息安全发展研究中心数据,截至 2018 年底,中国人工智能领域合计申请专利 44.4万件,而语音识别自然语言处理技术则合计申请专利 6.1 万件,占比达到 13.6%。这也说明,智能语音和自然语言理解的技术积累已经跨越了可用阶段,大规模应用和商业化的时代正在来临

图8:自然语言理解的代码统计(数据来源:GitHub)那么智能语音的商业模式又是怎样的呢?

我们根据272家企业名录选取了智能语音相关的企业,并参考这些企业的公司网站和媒体报道,以当前最为显著的业务进行了归类分析,进而得到图9智能语音公司的商业路径(需要说明这种归类比较泛化并且存在主观因素)。

从图9的结果来看,大部分人工智能企业其实聚焦到了与商业距离最近的AI方案领域,次之的则是面向消费领域的消费电子产品领域,也就是说大部分智能语音企业已经直达用户而脱离了供应链属性。即便从算法起家的国内智能语音创业公司也出现了较大的分化,比如科大讯飞现在以行业方案和消费产品为核心,思必驰云知声现在以语音芯片为核心,出门问问现在以消费电子品牌产品为核心,声智科技现在以AI操作系统为核心。国内大型企业比如华为小米、阿里和腾讯以消费电子品牌产品为主,百度科大讯飞则以产品为核心布局全产业链条,不仅提供AI芯片,也提供开放平台和操作系统。这里要强调一下AI操作系统,相对芯片来说AI操作系统并不受资本关注,国内从事这个技术领域的公司也很少,从技术自主性和应用普遍性来看市场上主要有百度的DuerOS、声智科技的Azero和科大讯飞的iFlyOS。其中百度的DuerOS在消费电子领域应用较广,声智科技的Azero则在运营商和中小客户领域应用较广,并且Azero在智能电梯、智能会议、智能测温、智能汽车等行业领域也有应用。

图9:智能语音的商业路径统计这样来看,智能语音的商业化探索路径和图像识别领域的创业公司类似,大多都是从算法起家,然后转型分叉到芯片、操作系统、产品或者解决方案领域。若从融资规模来看,智能语音企业的融资数量和规模都远小于图像识别企业,这与智能语音的技术成熟度与技术链条的复杂性都有相关性。这种技术复杂度也直接造成了智能语音企业早期商业变现的困难,甚至2008年就已上市的科大讯飞也备受质疑。但是我们也要从另一角度看到,智能语音企业在技术积累时期的煎熬,也验证了其技术链条的壁垒相对较高,其实等于用时间换空间,所以目前具备自主的全链条智能语音技术的创业公司也会相对较少,并且具有了一定的市场头部效应。

新冠疫情对智能语音行业的影响

我们先了解下智能语音企业的转型之痛。我们知道,随着智能语音和自然语言理解技术的成熟,成长起来的智能语音企业基本完成了技术积累,而且各自有所特色,于是各家开始积极转型抢占消费和行业市场。但是,智能语音企业要想跨过各自的转型门槛也是相当艰难。比如转型芯片的智能语音企业就要解决芯片成本和软件支持问题,转型产品的智能语音企业就要解决品牌和渠道问题,转型解决方案的智能语音企业就要解决定制和销售问题,转型操作系统的智能语音企业就要解决典型应用和生态体系问题。这绝对不是Martin Casado和Matt Bornstein在文章中所分析的是不是AIaaS的简单问题,因为成熟的智能语音企业基本都有开放平台,这可以解决中小客户的支持问题,但是开放平台的生态诉求显然会大于商业诉求,仅凭AIaaS在国内的商业生态其实难以生存。

另外,企业转型的同时也就意味着竞争对手的转变,这种竞争已经超越了智能语音企业之间的竞争,不再是声学算法、语音识别或者语言理解的技术竞争,而是产品体验和品牌渠道的竞争。事实上,这才是商业化的关键路径,但是这条路上挤满了竞争对手,而且很多都是超级强大的传统行业对手。坦诚来说,在这个路径上智能语音企业做的远远不够,即便百度、阿里和腾讯也没有在智能语音的商业探索中给出答案。

那么,新冠疫情会对智能语音产生怎样的影响呢?

首先来看,新冠疫情对于公共卫生领域非接触应用的强烈需求,帮助智能语音技术解决了一个商业化方面最大的问题,就是人们对于智能语音的商业认知问题。新冠疫情之前,人们对于智能语音的“刚需困境”谈论不休,甚至当智能音箱的全球销量超过了1.2亿台,人们对于智能音箱的价值也不以为然,声智科技因为与百度华为小米腾讯和阿里等联手推动远场语音交互技术,对此更是深有感触,而这个期间一些智能语音企业也转向了芯片领域。但是现在回头来看,智能音箱恰恰是智能语音技术进行大规模应用普及的排头兵,而且也正是智能音箱的出现才让人们具有了人机语音交互的初步意识,当然也有不少用户纯粹是因为感到新奇而购买了智能音箱。但是不管怎样,这种新兴市场的教育需要花费巨大的代价,整个智能音箱的市场补贴累计超过了100亿。试想这种技术早期启蒙阶段,智能语音行业怎么可能快速商业化突破呢?但是这次新冠疫情所带来的机会则不同,新冠疫情天然对于语音的非接触性就有强烈的需求,几乎不需要市场投入就加速了人们对于智能语音的认知转变,比如声智科技在疫情期间推出的AI语音电梯,就获得了新华社、人民日报、北京日报、中央卫视、北京卫视等各家媒体的广泛报道。

其次,新冠疫情帮助智能语音行业解决了行业应用的技术验证问题。智能语音之所以在解决方案领域相较图像识别领域的商业化要差一些,关键还是智能语音的精确度与图像识别相比来说直观体验不好,这种差别不是具体指标,而是人类本身对于声音感知就不如视觉感知更加准确,毕竟两者获取的数据量就不在一个量级。但是声音的好处就是Always-on且低功耗,并且声音数据因承载了人类的思想和情感更具商业价值,事实上各种设备如果要智能化必然就需要这个特性。新冠疫情期间很多设备和应用就具备了这种功能,比如科大讯飞的AI学习机、云知声的AI语音病历、思必驰的AI外呼机器人、声智科技的AI电梯、AI会议和AI数字人测温等,应用落地的门槛由于疫情的爆发反而大幅降低。

最后,新冠疫情也解决了智能语音行业的成本和安全问题。智能语音行业的技术链条太长,每个链条都需要大量的算法人才,这使人工智能企业的人才成本一直很高,所以在技术积累期间大家其实比拼的都是成本控制问题。实现同样的技术和效果,谁的成本控制的更低,谁的技术路线更合理,谁就会占据长期竞争优势。从这一点来看,互联网企业早期巨额投入智能语音行业的商业回报目前来看还是值得商榷,其商业化的诉求反而影响了早期阶段的技术路线和产品体验。当然,我们能理解互联网企业垂直一体化的诉求,但是在这个以分工为基本组织方式的商业社会,特色和专注应该是最为宝贵的商业经验。至于安全问题,这实际上不止是智能语音行业的问题,而是整个社会的问题,所以不能简单的以隐私安全问题就否定了新兴技术,对技术的价值观考量应该是对人的价值观考量。

到底是新基建还是新应用?

虽然国家提出的新基建投资将人工智能列为其中之一,但是人工智能到底是不是新基建呢?至少从现在来看,人工智能还不具备基础设施的一些基本属性,比如用户习惯问题、使用成本问题和用户隐私安全问题等还没有充分解决。而现在大部分人工智能公司集中于产品和解决方案环节,其实还是把人工智能作为了新应用来看待。这倒和互联网的发展轨迹比较类似,互联网早期甚至作为新应用都备受质疑。当然互联网现在大家认为是基础设施,没有网络似乎生活就会遭受重大影响,事实上也不是这样,没有互联网也能生存但是品质会大幅下降,人工智能其实也很类似。

历史只能参照,也不可能重现。2020年的新冠疫情对智能语音到底产生怎样的长期影响还有待观察,至于人工智能是不是能够成为新的基础设施,像互联网一样再次改变人类的生活,我们更是拭目以待。但是有一点非常重要,国家新基建的巨大投入肯定会加速人工智能的商业模式变革,带来更大的商业变现空间,而新的人工智能商业模式,肯定也是产生在更具创造性的企业,或许也是孕育在早期的混沌之中。

本文所引用的数据均标注了出处,并且附录了其中所参考的文献资料,其中文献1-5是媒体对于人工智能企业的分析参考,文献6-14是人工智能行业的专业调研报告,文献15-19是新冠疫情对于经济特别是中小企业的影响分析,文献20-22主要是本文思考和实证研究的方法参考。

参考资料:

1.Martin Casado and Matt Bornstein, The New Business of AI (and How It’s Different From Traditional Software), https://a16z.com/2020/02/16/the-new-business-of-ai-and-how-its-different-from-traditional-software/.

2.旷视IPO在即,看清“AI第一股”的商业真相,https://36kr.com/p/5296022.

3.刘燕,科大讯飞负重飞, https://www.36kr.com/p/5239021.

4.36Kr:2019年自动驾驶专题行研报告,https://www.36kr.com/p/5214334.

5.中商产业研究院:2019年中国人工智能芯片行业市场前景研究报告.

6.Metelskaia I, Ignatyeva O, Denef S, et al. A business model template for AI solutions[C]//Proceedings of the International Conference on Intelligent Science and Technology. 2018: 35-41.

7.Susan Athey and Michael Luca. "Economists (and Economics) in Tech Companies." [J]//Journal of Economic Perspectives .Volume 33, Number 1.Winter 2019.Pages 209-230.

8.2019中国人工智能产业投融资白皮书, https://www.chinaventure.com.cn/report/1010-20191213-1590.html.

9.2020年中国智能语音行业研究报告, https://www.iresearch.com.cn/Detail/report?id=3526&isfree=0.

10.Canalys: Global smart speaker market to grow 13% in 2020 despite coronavirus disruption. https://www.canalys.com/newsroom/-global-smart-speaker-market-Q4-2019-forecasts-2020.

11.2019 Github年度报告 https://octoverse.github.com/.

12.赛迪研究院,,2019赛迪人工智能企业百强榜研究报告,https://www.ccidgroup.com/gzdt/14288.htm.

13.胡润百富,中国人工智能产业知识产权发展白皮书. http://www.cbdio.com/image/site2/20191114/f42853157e261f3751d556.pdf.

14.AI 100: The Artificial Intelligence Startups Redefining Industries, https://www.cbinsights.com/research/artificial-intelligence-top-startups/.

15.Ruiz Estrada M A, Park D, Koutronas E, et al. The Economic Impact of Massive Infectious and Contagious Diseases: The Case of Wuhan Coronavirus[J]. Available at SSRN 3533771, 2020.

16.Luo S, Tsang K P. How Much of China and World GDP Has The Coronavirus Reduced?[J]. Available at SSRN 3543760, 2020.

17.Binder C. Coronavirus Fears and Macroeconomic Expectations[J]. Available at SSRN 3550858, 2020.

18.吴晓灵,王忠民等,CWM50报告:新冠肺炎疫情对经济的影响及对策建议.http://www.xinhuanet.com/money/2020-02/18/c_1125590528.htm.

19.朱武祥,刘军,魏炜, 清华北大联合调研995家中小企业,如何穿越3个月疫情生死火线,中欧商业评论.

20.刘俏,颜色,疫后中国经济政策的思考与建议——回归经济核心逻辑,聚焦高质量发展,http://www.gsm.pku.edu.cn/info/1316/21630.htm.

21.黄海洲,全球金融体系危机与变革,中信出版社,2019年1月第1版.

22.陈晓萍,沈伟,组织与管理研究的实证方法(第三版),北京大学出版社,2018年7月第1版.

产业智能语音声与智能
1
相关数据
声智科技机构

声智科技是融合声学和人工智能技术的平台服务商,致力于实现“让机器更智能”的使命,达成“用科技改善生活”的愿景,主要提供SoundAI Azero智能操作系统和服务,以及深度结合应用场景的人工智能技术和产品解决方案,典型应用于智能家居、智能会议、智能教育、智能医疗、智能制造、智能汽车、金融科技、能源电力、智慧法院、智能交通和机器人等领域,是全球最大的智能语音技术和平台服务商之一。

http://www.soundai.com
Waymo机构

Waymo是Alphabet公司(Google母公司)旗下的子公司,专注研发自动驾驶汽车,前身是Google于2009年开启的一项自动驾驶汽车计划,之后于2016年独立。2017年10月,Waymo开始在美国亚利桑那州的公开道路上试驾。2018年12月,Waymo在凤凰城郊区推出了首个商业自动乘车服务Waymo One。

http://www.waymo.com/
华为机构

华为创立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。

https://www.huawei.com/cn/
科大讯飞机构

科大讯飞股份有限公司成立于1999年,是亚太地区知名的智能语音和人工智能上市企业。自成立以来,长期从事语音及语言、自然语言理解、机器学习推理及自主学习等核心技术研究并保持了国际前沿技术水平;积极推动人工智能产品研发和行业应用落地,致力让机器“能听会说,能理解会思考”,用人工智能建设美好世界。2008年,公司在深圳证券交易所挂牌上市。

http://www.iflytek.com
出门问问机构

出门问问成立于2012年,是一家以语音交互和软硬结合为核心的人工智能公司,为全球40多个国家和地区的消费者、企业提供人工智能产品和服务。出门问问的使命是定义下一代人机交互,让人和机器的交互更自然。公司自主研发并建立了完整的“端到端”人机交互相关技术栈,包括声音信号处理、热词唤醒、语音识别、自然语言理解、对话管理、垂直搜索、智能推荐、语音合成、知识图谱等,并始终保持国际前沿技术水平。ToC场景推出了以智能手表TicWatch系列和无线耳机TicPods系列为主的可穿戴设备组合,ToB层面已为物联网、金融、电信、健康养老、餐饮、车载等企业级场景提供服务。

https://www.chumenwenwen.com/
思必驰机构

思必驰是国内领先的对话式人工智能平台公司,拥有全链路的智能语音语言技术,自主研发了新一代的人机交互平台(DUI),和人工智能芯片(TH1520);为车联网、IoT、以及众多行业场景合作伙伴提供自然语言交互解决方案。 思必驰拥有上千项知识产权,是国际上极少数拥有自主知识产权、中英文综合语音技术的公司之一;与阿里、腾讯、小米、富士康、OPPO、长虹、顺丰、龙湖地产等企业达成战略合作;旗下人工智能产业基金累计投资20+家生态企业。

http://www.aispeech.com/
云知声机构

云知声专注于物联网人工智能服务,是一家拥有完全自主知识产权、世界顶尖的智能语音识别、语义理解等技术的高新技术企业,总部位于北京,在上海、深圳、厦门、合肥设有子公司。公司员工500余人,核心研发团队近百人,其中 45% 拥有博士学历,工程师占比78%,拥有雄厚的科研和产业化实战能力。 云知声深入探索感知智能、认知智能、通用智能三大方向,在语音、语言、知识计算、大数据分析、人工智能芯片等领域建立了领先的核心技术体系,以此构建了完整的人工智能技术图谱。并率先在国内布局大规模异构并行超算平台 Atlas 和深度学习计算框架 UniFlow ,以领跑行业发展的技术实力,助力 AI 基础设施建设,服务国家 AI 战略。 基于“云、端、芯”技术产品体系,提供跨平台、跨场景,融合云端智能和本地智能一体化的 AI 系统解决方案,已在 AI 生活(家居、车载等)和 AI 服务(医疗、教育、政务、金融等)两大核心场景广泛落地。 目前合作伙伴数量已超过 2万家,覆盖用户已超过 2亿,日调用量超 4亿次,其中语音云平台覆盖的城市超过 647个,覆盖设备超过 1 亿台。 云知声自 2012 年成立以来,发展迅猛,备受人工智能行业及资本市场关注,累积融资数亿美元,并多次创下AI语音领域单轮融资记录。云知声连续两年入选福布斯中国最快科技成长公司 50 强企业,是中国人工智能行业成长最快的创业公司之一 。

https://www.unisound.com/
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

自然语言理解技术

自然语言理解是人工智能的核心课题之一,也被广泛认为是最困难和最具标志性的任务。最经典的两个人工智能思想实验——图灵测试和中文房间,都是围绕自然语言理解来构建的。自然语言理解在人工智能技术体系中的重要性不言而喻,它一方面承载着机器和人的交流,另一方面直达知识和逻辑。自然语言理解也是人工智能学者孜孜以求的圣杯,机器学习的巨擘 Michael I. Jordan 就曾经在 Reddit 上的 AMA(Ask Me Anything)栏目中畅想用十亿美元建立一个专门用于自然语言理解的实验室。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

语音合成技术

语音合成,又称文语转换(Text to Speech)技术,是将人类语音用人工的方式所产生,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。

语义分析技术

语义分析是编译过程的一个逻辑阶段, 语义分析的任务是对结构上正确的源程序进行上下文有关性质的审查,进行类型审查。语义分析是审查源程序有无语义错误,为代码生成阶段收集类型信息。比如语义分析的一个工作是进行类型审查,审查每个算符是否具有语言规范允许的运算对象,当不符合语言规范时,编译程序应报告错误。如有的编译程序要对实数用作数组下标的情况报告错误。又比如某些程序规定运算对象可被强制,那么当二目运算施于一整型和一实型对象时,编译程序应将整型转换为实型而不能认为是源程序的错误。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

操作系统技术

操作系统(英语:operating system,缩写作 OS)是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的内核与基石。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

阿里巴巴机构

阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的18人于1999年在浙江杭州创立的公司。

https://www.alibabagroup.com/
百度智能云机构

百度是全球最大的中文搜索引擎,是一家互联网综合信息服务公司,更是全球领先的人工智能平台型公司。2000年1月1日创立于中关村,公司创始人李彦宏拥有“超链分析”技术专利,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://www.baidu.com
旷视科技机构

旷视成立于2011年,是全球领先的人工智能产品和解决方案公司。深度学习是旷视的核心竞争力,我们打造出自研的AI生产力平台Brain++并开源其核心——深度学习框架“天元”,实现了算法的高效开发与部署。在持续引领技术进步的同时,我们推动AI产业的商业化落地,聚焦个人物联网、城市物联网、供应链物联网三大赛道,为个人用户带来更出色的美学体验与安全保障、让城市空间更有序、并帮助企业实现工业、仓储数字化升级。我们提供包括算法、软件和硬件产品在内的全栈式、一体化解决方案。

https://www.megvii.com
腾讯机构

腾讯,1998年11月诞生于中国深圳,是一家以互联网为基础的科技与文化公司。我们的使命是“通过互联网服务提升人类生活品质”。腾讯秉承着 “一切以用户价值为依归”的经营理念,为亿万网民提供优质的互联网综合服务。 腾讯的战略目标是“连接一切”,我们长期致力于社交平台与数字内容两大核心业务:一方面通过微信与QQ等社交平台,实现人与人、服务及设备的智慧连接;另一方面为数以亿计的用户提供优质的新闻、视频、游戏、音乐、文学、动漫、影业等数字内容产品及相关服务。我们还积极推动金融科技的发展,通过普及移动支付等技术能力,为智慧交通、智慧零售、智慧城市等领域提供有力支持。

http://www.tencent.com/
相关技术
小米集团机构

小米公司正式成立于2010年4月,是一家专注于智能手机自主研发的移动互联网公司,定位于高性能发烧手机。小米手机、MIUI、米聊是小米公司旗下三大核心业务。“为发烧而生”是小米的产品理念。小米公司首创了用互联网模式开发手机操作系统、发烧友参与开发改进的模式。2018年7月,工业和信息化部向与中国联合网络通信集团有限公司首批签约的15家企业发放了经营许可证,批准其经营移动通信转售业务,其中包括:小米科技有限责任公司。 2018年7月9日,正式登陆香港交易所主板 。

https://www.mi.com/
暂无评论
暂无评论~