Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

定义AI旗舰录音笔四大标准,讯飞智能录音笔系列重磅升级

5月27日,科大讯飞在京召开媒体沟通会,科大讯飞执行总裁胡郁、科大讯飞副总裁兼消费者事业群副总裁李传刚出席活动并共同宣布其消费者智能转写旗舰产品讯飞智能录音笔SR系列重磅升级。

作为大屏AI录音笔的开创者,讯飞智能录音笔面向商务记录、媒体记者、知识培训、律政精英四大场景和人群提供专业和全面的录音和转写服务。据悉,讯飞智能录音笔现网机型可在5月29日通过OTA进行升级。同时618大促活动,讯飞智能录音笔最高优惠620元,全场最高24期免息,并有好礼相赠。

讯飞智能录音笔三大升级

此次重磅升级标志着讯飞转写引擎的再次升级,从前端的录音、核心的转写能力,再到后端的用户编辑,均进行了全面升级。

在录音方面,讯飞智能录音新增支持录音声源定位,通过判断声源方向,实现更好的拾音效果。同时,产品增加非人声过滤,在音频播放时,可自动跳过没有人声的冗余录音,有效节约整理时间;而高增益降噪,使得产品在5-15米录音时,转写准确率提升20%,同时人声更加清晰。

在转写方面,讯飞智能录音笔新增粤语、河南话、四川话、重庆话、云南话、贵州话、天津话、河北话、东北话、甘肃话、山东话、太原话12种方言,行业首发藏语、维吾尔语2种少数名族语,并支持中、英、日、韩、俄、法、越南、西班牙8国语言转写。值得一提的是,升级后的讯飞智能录音笔SR系列支持财经贸易、医疗、IT科技、政法、文化体育、教育和运营商7大专业领域转写优化,保证特定语境下的转写正确率。同时,中英文混读识别功能也可在转写时自动识别夹杂着中英文的语音内容。

为了让用户更快速和准确地产出转写后的内容,讯飞智能录音笔进一步升级了智能编辑功能。智能语义分段可以根据语义的上下文进行分段,提升了用户针对转写文档的浏览体验;自动区分讲话人可实现根据录音及转写结果自动区分标注讲话人,一些特定采访情景下转出来的文档可以更方便的根据不同发言人查对内容;口语规整则可将语气词、重复词、无意义词过滤掉,展示更纯净的转写内容;智能摘要则是对录音内容进行全面的语义理解与分析,自动抽取关键信息,形成摘要结果;而个人词库可通过提前输入专属词汇,进行转写编辑优化。

讯飞定义AI旗舰录音笔行业四大标准

作为AI带屏转写录音笔的开创者,讯飞智能录音笔SR系列一直沿袭着用户使用场景,以识别准、录得远、录得清、语种全的四大标准驱动产品的的转写和迭代。

识别准方面,讯飞智能录音笔语音识别模块采用基于深度全序列卷积神经网络语音识别框架,识别准确率达98%;录得远方面,讯飞智能录音笔SR系列旗舰产品拾音距离最远可达15米;录得清方面,讯飞智能录音笔采用AI算法降噪处理前端语音信号保证拾音的准确性,并提供高清无损音质的音频格式;语种全方面,讯飞智能录音笔支持12种方言转写、2种少数名族语言转写、8国语言转写和7大专业领域转写优化。

除此之外,讯飞智能录音笔作为AI带屏录音笔的开创者支持1小时的会议录音,5分钟即可转写完成。其拥有丰富的“智能”功能,在文件管理上,满足了各场景记录者方便录、查找易、编辑快等需求。对于大量的文件素材,用户可利用内置的语音助手,通过语音就可以在海量的录音文件中搜索录音内容,一键直达重点处。此外,基于云账号,讯飞智能录音笔还支持用户在录音笔、手机APP、网页等多个客户端自动同步和管理数据,同时还能进行录音回听、文稿编辑、一键导出等操作,对用户来说大大增加了整理工作的便捷性。

硬件层面,讯飞智能录音笔也使用了专业级配置如2+6麦克风阵列组合,支持4G、WIFI等多种网络连接方式,指纹解锁模块,2000毫安时大容量电池并支持快充。讯飞智能录音笔能在会议、采访、演出、音乐会等不同录音场景下,调动8个麦克风实现录音以及360度环绕无死角收声,为你的会议记录保驾护航。

持续领跑市场讯飞智能录音笔树立AI录音笔行业标杆

作为科大讯飞智能语音技术的代表产品之一,讯飞智能录音笔SR系列一经推出便以创新的产品设计和AI能力打破了传统录音笔品类的沉寂之势,获得专业人士的一致认可。在2019年双11中,讯飞智能录音笔一跃登顶成为天猫&京东双平台录音笔品类和单品销售额双料冠军,11号当日京东成交金额指数更是超过其他品牌之和。

讯飞智能录音笔能解决专业人士的痛点,和科大讯飞在智能语音领域二十一年的深耕分不开。只以语音转写功能应用到的语音识别技术为例,早在2016年9月,在业界影响力最大、参赛队伍最多、水平最高的国际多通道语音分离和识别大赛CHiME-4中,科大讯飞包揽了全部三个项目的冠军;2018年再次包揽CHiME-5大赛全部四个项目的冠军并大幅刷新了各项目的最好成绩;2020年的CHiME-6,在被称为“史上最难的语音识别任务”中,科大讯飞不仅在给定说话人边界的多通道语音识别两个参赛任务上夺冠,更一鼓作气刷新自己在CHiME-5中46.1%的语音识别错误率冠军成绩,直降至30.5%。

讯飞智能录音笔2019年5月发布后,也屡获行业产品大奖。凭借优秀的外观设计,讯飞智能录音笔获得iF设计大奖,通过其强劲的性能和优质的使用体验斩获亚洲消费电子展创新奖,京东电脑数码年度最佳新品,脉脉年度盛典最喜欢数码产品以及中国品牌日国货新品。

在最近召开的2020年全国两会中,讯飞智能录音笔更成为了人民网、文汇报、齐鲁晚报、21世纪经济报道4家媒体记者团报道两会的指定录音笔,同时还是2020年全国两会安徽媒体团指定产品,助力记者等专业人士在两会期间记录民声所向。

今年6月1日-6月18日期间,消费者购买讯飞智能录音笔最高优惠可达620元并最高可享受24期免息,全场购机均有好礼相赠。

产业科大讯飞智能录音笔AI
相关数据
科大讯飞机构

科大讯飞股份有限公司成立于1999年,是亚太地区知名的智能语音和人工智能上市企业。自成立以来,长期从事语音及语言、自然语言理解、机器学习推理及自主学习等核心技术研究并保持了国际前沿技术水平;积极推动人工智能产品研发和行业应用落地,致力让机器“能听会说,能理解会思考”,用人工智能建设美好世界。2008年,公司在深圳证券交易所挂牌上市。

http://www.iflytek.com
卷积神经网络技术

卷积神经网路(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网路由一个或多个卷积层和顶端的全连通层(对应经典的神经网路)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网路能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网路在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网路,卷积神经网路需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。 卷积网络是一种专门用于处理具有已知的、网格状拓扑的数据的神经网络。例如时间序列数据,它可以被认为是以一定时间间隔采样的一维网格,又如图像数据,其可以被认为是二维像素网格。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

麦克风阵列技术

麦克风阵列(Microphone Array),从字面上,指的是麦克风的排列。也就是说由一定数目的声学传感器(一般是麦克风)组成,用来对声场的空间特性进行采样并处理的系统。 早在20世纪70、80年代,麦克风阵列已经被应用于语音信号处理的研究中,进入90年代以来,基于麦克风阵列的语音信号处理算法逐渐成为一个新的研究热点。而到了“声控时代”,这项技术的重要性显得尤为突出。

京东机构

京东(股票代码:JD),中国自营式电商企业,创始人刘强东担任京东集团董事局主席兼首席执行官。旗下设有京东零售、京东物流、京东科技子集团、印尼&泰国海外合资跨境电商等核心业务。2013年正式获得虚拟运营商牌照。2014年5月在美国纳斯达克证券交易所正式挂牌上市。 2016年6月与沃尔玛达成深度战略合作。

https://www.jd.com
相关技术
语音分离技术

语音分离是指将不同说话者的声音分离或将噪声(背景干扰)与原始音频信号分离。

推荐文章
暂无评论
暂无评论~