Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

机器之心编译机器之心发布

百度语音输入服务率先赋能罗技,软硬一体“黑科技”鼠标问世

百度正式发布语音输入服务产品,高效赋能外设硬件助力智能化升级。

智能语音已经进入爆发期。4月13日,百度AI全面赋能罗技合作启动仪式暨罗技VOICE M380语音鼠标上市发布会在京举行。会上,百度正式发布“语音输入服务”并宣布百度大脑和罗技达成合作,将领先的AI技术全面赋能罗技外设硬件,以“智能鼠标”为起点,助力智能时代人机交互体验的加速升级。

伴随着科技发展与市场需求,技术服务于载体的能力不断增强。百度集团副总裁吴甜指出:“百度和罗技都在以自己的产品体系为消费者持续打造全面、丰富、具有创造力的产品。百度一直在用人工智能技术提升产品体验,经过多年在人工智能技术相关的研发和应用实践,这些技术积累沉淀到了百度大脑。而百度大脑当中两个经典的AI技术就是语音技术和机器翻译。语音技术可让用户免去打字输入的麻烦,以更自然的交互方式搜索信息,找到所求;而机器翻译则在全球化进程发展的今天,为跨语种的交流带来巨大便利。”

百度集团副总裁吴甜

而在启动仪式上,罗技全球副总裁、罗技大中华区总裁蒋志兴表示,罗技经过40年的发展,已经成为全球云周边设备的领导厂商。而百度是全球领先的人工智能平台型企业,也是国家AI新基建的重要推动者和贡献者。我们对新场景新需求的探索永无止境,今天的发布会只是我们合作的开始。未来我们将会推出更多的产品,更多的应用,更多的体验,服务于更多的消费者和企业用户。

百度AI全面赋能罗技合作启动仪式中,凝聚双方智慧的罗技VOICE M380语音鼠标首次亮相。罗技全球副总裁、罗技全球C&P品类总经理Delphine Donne-Crock也发来致辞视频。她表示,我们期待将流畅自然的沟通能力与体验全部赋能在PC端用户的体验中,带去突破智能化办公场景的全新体验。

百度AI全面赋能罗技合作启动仪式

此外,活动现场百度总监蔡玉婷宣布“百度语音输入”服务正式发布,并全面赋能在罗技VOICE M380语音鼠标中,实现自由说、实时译的功能。基于百度大脑语音识别机器翻译,用户在办公场景下可实现所说即所得。百度大脑语音识别赋能下的语音鼠标可支持中文、英文、日文3种语言语音输入,中英混合输入,以及粤语、四川话、东北话、河南话、山东话、西安话、合肥话等7种方言语音输入,尤其在长篇内容输入时方便用户获得轻松畅快的输入体验。此外,新品语音鼠标中还添加百度大脑语音翻译功能,可自由实现中译英、中译日、中译韩、中译法、中译西、中译泰、英译中、日译中8种语音翻译,服务人群更加广泛,帮助不同国界的用户跨越语言障碍,获得更加顺畅自如的沟通体验。

罗技VOICE M380无线语音鼠标

事实上,百度AI技术的进化和产业赋能始终保持着正向循环,相互促进。以百度大脑语音技术为例,2019年百度推出并上线使用的流式多级的截断注意力模型SMLTA应用到了百度输入法当中,大幅提升了自身语音识别准确率;此外,在远场交互的场景下,百度推出的基于麦克风阵列的声音增强以及声学建模一体化端到端识别技术,也应用到了小度音箱等场景下,优化了整体交互时的准确率。截至目前,百度语音技术服务日调用量已超155亿次;在移动端的设备上,百度搜索、输入法、百度地图等产品,以及智能设备的场景上,比如智能家居、智能车载系统、语音IoT设备等中都有非常广泛的应用。同时,百度也推出了语音AI芯片百度鸿鹄,在功耗和性能方面也具有领先的技术优势。

同样,机器翻译也是百度很早就开始积累和打造的AI系统技术之一。2015年5月,百度发布全球首个互联网神经网络翻译系统;2019年在国际权威机器翻译评测WMT中,百度超越国内外知名企业,在中英翻译位列第一;而在多语言翻译方面,针对语言数量多、分布不均衡、实现难度大等难题,百度研发了基于神经网络的多语言翻译统一框架,世界范围内首次突破203种语言互译,翻译质量业内领先。从演变来看,百度一直在多种技术中占据着世界级领先优势,助力百度自身业务发展的同时,可以更好地赋能多场景、多产业应用。

当天,在“语音输入的变迁与未来”圆桌讨论环节中,罗技大中华区品类营销总监张亮、罗技C&P品类全球高级产品经理王小云、百度语音首席架构师贾磊、百度总监蔡玉婷等业内专家围绕智能语音技术未来发展趋势、破局,以及技术挑战等内容展开交流讨论。

圆桌论坛现场

AI要在广泛的场景落地应用,并不断解决实际问题创造价值。百度大脑已对外开放270多项核心AI技术能力,广泛地落地生根于互联网、工业、农业、金融、城市、医疗、能源、教育等诸多行业。

不难感受到,百度作为拥有强大互联网基础的领先AI公司,基于百度大脑技术引擎,通过智能云以全面领先的技术优势为开发者和企业持续赋能,助力打造具备智能体验的特色应用与产品,加快AI在各行各业的应用落地进程。

产业语音鼠标罗技百度
相关数据
人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

机器翻译技术

机器翻译(MT)是利用机器的力量「自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)」。机器翻译方法通常可分成三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

麦克风阵列技术

麦克风阵列(Microphone Array),从字面上,指的是麦克风的排列。也就是说由一定数目的声学传感器(一般是麦克风)组成,用来对声场的空间特性进行采样并处理的系统。 早在20世纪70、80年代,麦克风阵列已经被应用于语音信号处理的研究中,进入90年代以来,基于麦克风阵列的语音信号处理算法逐渐成为一个新的研究热点。而到了“声控时代”,这项技术的重要性显得尤为突出。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

百度机构

百度是全球领先的人工智能平台型公司。百度大脑是中国领先的“软硬一体AI大生产平台”,是百度AI的集大成,对外全方位输出超过270多项核心AI能力,服务230万开发者。飞桨是中国首个全面开源开放、功能完备的产业级深度学习平台,是中国自主研发的“智能时代的操作系统”。百度智能云是百度AI To B 业务的重要承载者和输出者,是产业智能化领导者。小度助手是中国领先的对话式人工智能操作系统,拥有中国市场最繁荣、开放的对话式人工智能生态,今年6月,小度助手语音交互次数超过58亿次。作为全球领先的、最活跃的自动驾驶开放平台,百度Apollo代表中国最强自动驾驶实力,被知名研究公司Navigant Research列为全球四大自动驾驶领域领导者之一。目前聚焦在以自动驾驶、汽车智能化、智能交通为核心的三大赛道。自动驾驶技术方面,超过十项中国第一,实力领跑行业。智能交通方面,百度 “ACE交通引擎”是全球首个车路行融合的全栈式智能交通解决方案。

https://www.baidu.com/
推荐文章
暂无评论
暂无评论~