产业资讯方案大厅机构大厅

百度

BAIDU

机器学习深度学习自然语言处理
http://home.baidu.com/

机构介绍

百度(纳斯达克:BIDU),全球最大的中文搜索引擎、最大的中文网站。1999年底,身在美国硅谷的李彦宏看到了中国互联网及中文搜索引擎服务的巨大发展潜力,抱着技术改变世界的梦想,他毅然辞掉硅谷的高薪工作,携搜索引擎专利技术,于 2000年1月1日在中关村创建了百度公司。 “百度”二字,来自于八百年前南宋词人辛弃疾的一句词:众里寻他千百度。这句话描述了词人对理想的执着追求。 百度拥有数万名研发工程师,这是中国乃至全球最为优秀的技术团队。这支队伍掌握着世界上最为先进的搜索引擎技术,使百度成为中国掌握世界尖端科学核心技术的中国高科技企业,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

产品及解决方案

人脸核身方案

计算机视觉金融交通运输与物流通信及信息技术

AI 图书馆方案

自然语言处理人机交互技术知识图谱机器学习

当前,由于资源库的繁杂与零散,资料查找较为不便,内容无法及时更新,且资源共享渠道不够畅通,存在信息孤岛的问题,难以支撑强大的知识体系和满足师生获取新知的需求。AI 图书馆方案旨在解决高校传统图书馆的资源利用问题,方案囊括了资源共享、个性化定制、大数据追踪记录以及智能化检索体验等计划,以提高资源利用效率,并利用人工智能技术深度分析数据,了解学生阅读的兴趣,包括学习行为,以在未来实现个性化学习,个性化教育。

疲劳驾驶监测系统

计算机视觉交通运输与物流

疲劳驾驶监测系统一旦检测到司机疲劳到了一定程度,系统会开始通过播放一些欢快的音乐,来帮助司机提神。 当监测到司机已经重度疲劳驾驶时,系统还会将司机导航到最近的休息区。

语音合成系统

深度神经网络机器学习语音合成通信及信息技术

百度推出了一个名叫 DeepVoice 的全新人工智能系统,借助热门的深度学习技术,它能够实现文本到语音(TTS)的转换。该系统还可以每次学习一种声音,在数小时后即可掌握。DeepVoice,可以轻松训练 AI 合成百种英文口音。研发团队发现,AI 把不同口音的演讲者,对应到嵌入空间的不同区域里。比如来自大不列颠岛和北美大陆的人,在嵌入空间里占据的区域也有明显的不同。 以前的 TTS 系统会在某些环节上采用深度学习,但在 Deep Voice 之前,没有团队采用全深度学习的框架。与现有技术相比,这个系统非常高效,专为生产系统而设计。相比于 DeepMind 关于人类音频合成的中实现的 WaveNet,现在这个系统的有效速度提升了 400 倍。Deep Voice 可以在几分之一秒内合成音频,并在合成速度和音频质量之间提供可调和的权衡。相比之下,WaveNet 合成一秒钟的音频,系统需要跑好几分钟。

大规模分布式仿真平台

自动化技术机器学习分布式计算技术交通运输与物流

真实道路情况下,车载算法是在车载电脑上运行,实时性要求很高,所以往往需要保留较多的系统资源冗余(以应对随时到来的系统处理颠簸的情况),万一出现颠簸状态,实时系统会采用丢帧的方式以保证运行时消息处理的低延迟。在仿真系统里,这是在离线运行。如果不做任何处理,我们需要用更强力的服务器,保留更多的系统资源,或者降低运行速率,以保证不丢帧。很显然,这种做法一方面带来大量的运行资源的闲置,另一方面降低了我们的运行速度。所以 Apollo 仿真平台引入了动态变速仿真技术。通过这两项改造,可以达到:不等待,不丢帧,这样就可以充分的利用硬件资源,以最快速度运行。据实际测试,采用了动态变速仿真技术,在不影响仿真结果的前提下,单机仿真效率可以提升数倍以上。 度量算法的本质可以认为是:f(场景描述,车辆轨迹),即某种场景和轨迹的二元函数。当我们拥有大量的正例以及负例,我们通过机器学习方法,基于大量数据,是可以得到一种具有足够泛化能力的,并且能够达到图灵测试判定能力的度量能力。事实上,百度长期的无人车路测,使仿真拥有了大量的实际的运营 / 路跑数据,我们针对性的大量采集、标注了细粒度的体感异常的 badcase 样本,进而可以达到相当精准的异常判断能力。

百度地图

交通运输与物流

百度同时部署全景采集车、采集自行车、全景采集背包、室内图采集背包以及正在测试阶段的无人机采集设备,五大利器协同作战,结合「1+0」单人采集模式、LiDAR 点云系统全景采集等核心技术,形成业内首创的「多栖组合模式」,应对多种地形地貌、不同场景的地图数据采集需求。 百度地图数据自动化处理程度已达到 90%,能自动识别包交通标志、地面标志、车道线、信号灯等上百种目标,相对精度达 0.1-0.2米,准确率高达 95% 以上,数据可以实现分钟级的更新。

创作大脑

自然语言处理语音识别机器学习AR/VR/MR知识图谱文体娱乐通信及信息技术

百度开发的该平台可辅助作者创作文本、视频、AR 作品等内容,具有以下功能。 1. 智能纠错:基于 NLP 技术,平台的智能纠错功能识别准确率已超过 95%,相当于国内一流大学的学生的平均能力; 2. 视频理解:平台引入视觉理解技术,在长视频中根据画面视觉、人物动作幅度、音频强弱等多维度组合,提取其中的精彩片段,自动生成短视频供作者创作使用; 3. 知识图谱:平台在 CMS 编辑器引入知识图谱内容。写作过程,根据作者上下文内容识别、切词,从知识图谱引入和关键词相关内容资料,供用户写作参考; 4. 视频转图文:平台引入百度云视频理解能力,根据作者上传视频,通过 OCR 及语音识别技术,提取视频内容转为文字,结合自然语言识别合成能力,整理成可阅读文章,供作者编辑、发布; 5. 在线视频编辑:平台提供专业软件级别的在线编辑能力,包括视频的拼接、转场、配音等;基于人工智能技术,平台还提供导演级的自动匹配素材、自动合成配音等能力; 6. AR & 全景素材开放平台:内容创作者们可以把自己制作的 AR 素材或者全景素材分享至开放素材库,也可使用库内其他创作者的素材。在全景素材上,各领域的作者们可以在此进行二次协同创作。

百度AI协作板块

计算机视觉通信及信息技术

智能音箱

人工智能硬件自然语言处理语音识别其他

小派电视智能音响因对内置的 OTT 盒子软件做了深度适配,打造了适用于大屏的交互 UI,围绕音乐,影视、有声读物、一般信息呈现、控制设置等都做了视觉及交互层的优化,结合音响本身具备的 3-5 米远场拾音能力,用户可以在客厅范围轻松实现语音影视点播,语音多能交互、系统控制等操作。该智能音响具备视频功能,经创维智能应用团队精心为其调制了 K 歌模式,实现了用户在家想唱就唱,唱得响亮的娱乐场景。 该智能音响具备视频功能,经创维智能应用团队精心为其调制了 K 歌模式,实现了用户在家想唱就唱,唱得响亮的娱乐场景。

模型

深度学习语音识别通信及信息技术

百度无人驾驶系统

深度学习其他

WiFi翻译机

语音识别自然语言处理企业服务

WiFi翻译机不仅翻译精准,而且自动识别用户所说的话并翻译到目标语种,实现与外国友人的无障碍交流,适合各个年龄层的用户使用。截至2017 年 12 月,翻译机已经上线了中英互译机型,中日互译、中韩互译也将陆续上线。

自动驾驶共享汽车

交通运输与物流

百度人脸识别技术解决方案

聚类机器学习生物特征识别公共设施

百度的人脸识别技术可对静态人像库、动态视频流中的人脸进行精准识别,整合人脸跟踪与捕获、实时布控、大规模人脸检索与比对等能力,提供完整易用的系统化解决方案。能够实现公共场所的全面布控,实时监控,并能够灵活适配多种人脸追踪、特定区域布控、特定人脸告警等功能,大大提升了安全性和安防效率。 百度人脸识别技术的优势可以体现为三点: 1.大规模人脸检索: 支持百万量级人脸库检索,检索速度业内领先,可应对各种业务需求; 2.识别精度高:人脸识别技术国际领先,识别准确率超过 99%,识别效果国际领先; 3.完善的解决方案: 提供适配具体场景的完整解决方案。

人脸自助查询(借还)机

计算机视觉其他

人脸识别会员系统

计算机视觉生物特征识别通信及信息技术

百度地图

计算机视觉数据科学机器学习深度学习交通运输与物流

Ipad 刷脸签到系统

生物特征识别计算机视觉其他