半夏 撰写

科大讯飞1024发布会全纪录:坚持「人机耦合」落地,发布iFLYOS开放平台做生态

回应近期质疑、发布2018年“1024”计划、发布讯飞听见M1机器人,科大讯飞在10月24日中国程序员节这天,举办了“首届世界声博会暨2018年科大讯飞全球1024开发者节”。

科大讯飞董事长刘庆峰对目前科大讯飞的相关问题做出正面回应:

我们的机器翻译和好的同传译者相比,还是有很大差距的,因为我们好多同传工作者,都会在原始的语音基础上进行再加工,以便实现信达雅,机器目前距离这个目标还有很大差距。

目前,机器翻译已经可以很好的满足实用需求,但我们从来不认为机器翻译已经达到了顶级同传、超过了顶级同传和我们的翻译工作者的水平,这就是今天技术的现状。

当然,我们的机器翻译已经超过了大学六级的水平,在针对大学六级的考试中,我们抽样了部分地方的实际考生的数据,其中专门有翻译的题目一共15分,我们的考生平均得分是6.5,而科大讯飞的翻译机得分是12.8。

科大讯飞执行总裁胡郁对科大讯飞“AI拿地门”做出正面回应:

讯飞不做房地产,我们年报中也没有关于房地产的收入。如果做房地产,科大讯飞早就发了,而不是现在体量的发展态势。我们的众创空间都是租的,当然,一些地方政府愿意吸纳生态型的企业,愿意和科大讯飞合作,有时还会减免一些租金,但北上广深杭等发达的地方建立自己的众创空间,我们还是自掏腰包的。

科大讯飞听见事业部总经理王玮对“人机耦合”做出正面回应:

讯飞听见的Slogan是“所听即所见”,听见1.0主要是语音识别技术,听见2.0版本加入了机器自动翻译功能,可以把英文实时翻译出来,其识别的可理解度只能达到80%,做到通用场景下对大意的理解,但很多诸如医疗、科技等垂直领域,机器翻译自动翻译且达到“信达雅”是不可能的。

我们从来没有说过是取代同传的,而只是和同传进行合作,进行语音转文字,当然,我们还有一个讯飞口译助手,里面会有交传模式和同传模式,在交传模式中,人可以对语言的逻辑结构等进行思考,机器则对数字、细节等不容易记忆的地方进行处理,两者合作起来,一起为同一件事情做服务,这才是人机耦合。

我们在每次的合作开始的时候,都会对同传进行介绍,比如苹果发布会,比如普吉新闻发布会,等等。人工智能的发展会对传统行业带来冲击和改变,这样自然大家就会产生误会和恐慌,这是历史发展的必然阶段。

但未来并不是机器取代人,人有创造力,可以操作机器,最终的结果只会是,使用了人工智能和机器的人取代了传统的从业者,比如汽车司机取代了马车夫,马车夫最后都学会了开汽车。这个是大势所趋,本次事件的爆发也是好事情,这样会促进我们把事情往正确的道路上推。

之后,科大讯飞还宣布推出“1024”计划,推出iFLYOS,以及正式推出了讯飞听见M1机器人。

而在此之前,科大讯飞已经一口气发布了多个领域里10款以上人工智能产品,可谓全面进军AI市场,也就是媒体所说的转型TO C市场。资料显示,截止2018上半年,科大讯飞 To C业务营业收入10.84亿,同比增长129.69%;To C业务在整体营收中占比达33.76%。

刘庆峰机器翻译达到大学六级水平

在此次大会上,刘庆峰做了主题发言,他提到, 人工智能时代有两个非常重要的趋势。

其中一个就是万物互联。这是最近两年全球消费电子展、世界互联网发展报告都能明确看到的大趋势,作为IT产业的第六次浪潮,越来越多的穿戴式设备、智能家居、便携终端和车载设备开始普及。

在这过程中,随着中国5G建设的即将大规模到来,更将大力推动万物互联时代的发展,将会比手机为代表的移动互联网时代的终端数呈现十倍以上的增长。而在这个领域,人们对更自然的人机交互也会提出更高的要求。

另外随着人工智能时代的蓬勃发展,基于数据驱动技术进步的应用发展成为社会非常重要的方式。数据驱动要求我们在数据汇聚的同时,进一步对用户的隐私保护提出了越来越高的要求,全世界范围内都在高度关注。

他表示,机器翻译用在日常生活的沟通交流时,已经达到甚至超过了大学英语六级口语水平,已经可以很好的满足实际生活应用场景的需要。

2015年科大讯飞就已经在北京国家会议中心请了最有名的公证机构,第一次让语音识别机器和人对比,现场公证并网上视频直播,在几十万观众的直接现场观摩下机器自动转写,讯飞听见就超过了人类速记员,准确率达到了95%,而平均值准确率只有不到80%。

但和好的同传相比,科大讯飞还有很大差距。因为好的同传、好的翻译人员、翻译艺术家和工作者们,他们是对原始语音进行提炼进行再加工,以便实现信雅达,机器距离目标还有很大差距。

机器翻译已经可以很好的满足实用需求,但科大讯飞从来不认为机器翻译已经达到了顶级同传、超过了顶级同传和我们的翻译工作者的水平,这就是今天技术的现状。

为什么说科大讯飞机器翻译超过大学六级的水平?我们针对大学英语六级的考试、真实的三次考试,抽样了部分地方的实际考生的数据,其中专门有翻译的题目一共15分,我们的考生平均得分是6.5,而科大讯飞的翻译机得分是12.8。

在今天会议上,所有嘉宾的发言,不用做任何训练,离线的语音识别准确率可以做到95%以上,超过了人类的速记员。所以结合最好的语音识别、最好的语音合成,再加上文字到文字的翻译,才使得科大讯飞可以做出如今的翻译产品。

目前,人工智能最重要的是应用,落地应用是硬道理,而不要光忽悠概念。在真正的没有先验知识、常识推理的人工智能才刚刚起步,不过人工智能却可以给我们带来巨大的社会生产和生活方式的改变。

不光是科大讯飞,随着技术在各种专业有数据、有逻辑规律可循的场合,会大量替代现有的工作岗位,提升现有的工作效率。

在刘庆峰看来,只要有数据、有规律可循的领域,机器代替人50%、77%,根本不用等到2045年,未来十年之内就将变成现实。所以我们每个人今天都应该关注人工智能,我们每个创业者都应该了解人工智能的大趋势,这是必然的趋势。

就像当年英国的红旗法案对汽车的限制一样,最后汽车没有限制住,还使得英国在汽车工业上整整落后了30年、耽误了30年。

在这个过程中,人机耦合是人工智能系统应用落地的关键,即便在各种行业领域有数据和规律可循,大家也需要最好的人工智能算法、行业数据和应用专家共同的打磨。

如何研究人工智能时代人和机器的耦合也是人工智能时代背景下,社会伦理和人文发展的需要,不能让机器完全代替人,而是让每个人都站在人工智能的平台之上,从而享受人工智能,这也是人机耦合的内在精神动力。

人工智能的大潮绝不是某个行业某个个人想阻挡就可以阻挡得了的,即便中国不做,全世界也会做。所以只有顺应这个时代,用好人工智能才是当前的明智之举。

1024计划:IFLYOS正式推出

在大会现场,胡郁谈到了人工智能的趋势所在。“我们将看到一个去中心化的商业系统,或者按照我们讯飞的话来说,是:混合正交的商业生态正在变得越来越重要、越来越成熟。”

什么叫混合正交的商业生态?但是在一个去中心化的混合正交的商业生态系统中,开发者、传统企业、互联网企业、人工智能企业……大家像编一个篮子一样,混合正交地把大篮子编出来,而篮子里面存放的就是整个生态系统,由所有编成篮子的参与方共同来分享生态系统。

为此,胡郁还发布了2018年“1024”计划,也是去年“1024计划”的升级版:IFLYOS。我们会提供整个的2.0的方案,包括生态2.0,包括教引2.0,包括公益2.0。

在教引计划里面,科大讯飞会建立新的课程建设计划导师,希望大家能够用到更多的功能,我们希望全平台可用、零学习门槛、快速集成和业务自定义。

除此之外,科大讯飞还提供了最新的1024的投资基金。投资基金将分为三个层面:第一个层面是一级基金,主要是种子基金,利用我们的品牌优势为大家赋能;第二个层面是天使基金,让科大讯飞的渠道能量能够为天使基金的各位开发者赋能;第三个层面就是星光加速器。开发者都会通过不同的加速器和基金的联合支持来获取他们更大的能量。

最后是AI公益。在新一年的计划里,科大讯飞会把暴风雪竞赛的最先进的技术全部放进来,也会招募方言保护计划的各个方面的成员,扩大语音识别所有能够支持的方言的种类,总共多达24种方言。

此前,在2017届全球1024开发者节,科大讯飞执行总裁胡郁曾宣布科大讯飞推出“1024计划”,其中包括“教引计划”、“生态计划”和“公益计划”,提供6期AI生态沙龙、14个AI众创空间、10.24亿扶持基金、AI大学、方言保护计划等实际行动。

他也发布了2017年发布该计划之后的一些成果:

科大讯飞三季报出炉

就在23日晚间,科大讯飞公布了今年第三季度的财务报告。

报告显示,今年前三季度科大讯飞实现营业收入52.83亿元,较去年同期增长 56%,毛利同比增长 53.40%;科大讯飞第三季度单季度总营收20.7亿元,同比增长61.4%,前三季度收入和毛利接近2017年全年总和。

此外,财报显示,前三季度实现归属于上市公司股东的净利润较上年同期增长29.94%,实现归属于上市公司股东的扣除非经常性损益的净利润较上年同期下降79.75%。

从具体投入来看,今年前三季度科大讯飞研发费用总额达 6.98 亿元,较上年同期增长 69.45%;销售费用总额达 11.79 亿元,较上年同期增长 68.75%。上述费用成本的增加影响了当期税后利润增幅。

而对于扣除非经常性损益的净利润大幅下滑,科大讯飞解释称,当前正值人工智能产业爆发的关键窗口期,公司持续加大人工智能相关领域的研发投入、生态体系构建的投入以及在教育、政法、医疗、智慧城市等重点赛道的市场布局投入。

相应地,今年前三季度员工规模增长较快,新增人员带来当期薪酬、费用的提升,直接导致前三季度扣除非经常性损益的净利润下滑较多。

在此之前,短短一个月里, “AI造假门”、“AI拿地门”相继向科大讯飞袭来,科大讯飞的市值甚至相较去年11月份市值的最高点976亿元,蒸发了超过550亿元。

但随后,科大讯飞相继发布了董事长兼总裁刘庆峰,以及全体高管自筹资金提前增持公司股份的计划,拟增持股份的规模合计不低于2500万元,其中刘庆峰的增持计划为不低于1200万元,其目前持有1.58亿股,持股比例为7.53%,为公司第二大股东和实际控制人。

科大讯飞十大股东

结语

 比人类更强大的不是AI,而是掌握了AI的人类。

只是如今,就像美国斯坦福全球创新设计联盟联席主席蒋里在接受记者采访时说的一样,现在人工智能在全球比较火,每个人都能聊上两句,但大家要有能力,哪些是人工智能可以搞得定的,哪些是只有人才能搞得定的,这两者之间要划分清楚。

对于科大讯飞来说,也是如此。

AI锐见
AI锐见

洞察AI行业趋势

产业iFLYOS人机耦合语音合成人机交互语音识别机器翻译科大讯飞
3
相关数据
科大讯飞机构

科大讯飞股份有限公司成立于1999年,是亚太地区知名的智能语音和人工智能上市企业。自成立以来,长期从事语音及语言、自然语言理解、机器学习推理及自主学习等核心技术研究并保持了国际前沿技术水平;积极推动人工智能产品研发和行业应用落地,致力让机器“能听会说,能理解会思考”,用人工智能建设美好世界。2008年,公司在深圳证券交易所挂牌上市(股票代码:002230)。

http://www.iflytek.com
人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

语音合成技术

语音合成,又称文语转换(Text to Speech)技术,是将人类语音用人工的方式所产生,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。

机器翻译技术

机器翻译(MT)是利用机器的力量「自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)」。机器翻译方法通常可分成三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

先验知识技术

先验(apriori ;也译作 先天)在拉丁文中指“来自先前的东西”,或稍稍引申指“在经验之前”。近代西方传统中,认为先验指无需经验或先于经验获得的知识。先验知识不依赖于经验,比如,数学式子2+2=4;恒真命题“所有的单身汉一定没有结婚”;以及来自纯粹理性的推断“本体论证明”

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

暂无评论
暂无评论~