Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

百度大脑开放日NLP专场,感受技术如何让机器更「懂」人类

7月31日,第四期百度大脑开放日在北京中关村创业大街百度大脑创新体验中心举行,迎来首次NLP专场。本期活动一如既往介绍了百度大脑近期最新开放和升级的能力,还重点解读了百度大脑在自然语言处理方向的最新技术突破与开放布局,同时邀请央视网、国美管家、纵横文学的技术负责人分享了基于百度自然语言处理技术的应用创新与已落地的场景案例,切实展现了百度大脑AI产业化加速落地的成果。

AI大生产平台 将“软硬一体”同步升级进行到底

2019年百度AI开发者大会上,百度大脑5.0全面跨越升级为软硬一体的AI大生产平台,在算法突破、计算架构升级的基础上,实现AI算法、计算架构与应用场景融合创新,并实现AI技术的标准化、自动化、模块化。目前,百度大脑已是服务规模最大的AI开放平台,有超过130万开发者使用,开放了超过210项核心技术能力,并面向广泛的企业和开发者,不断降低着AI应用落地的门槛。

在第四期开放日上,百度AI技术生态部高级产品经理娄双双详细介绍了百度大脑在6-7月新开放与升级的产品能力共22项,包含新能力开放、开发平台的全新升级、以及新硬件的发布等,还与现场的合作伙伴、开发者们互动,分享了这些技术赋能行业的实际案例。

在视觉方向,人体分析与车辆识别方向有3项新能力开放包括:手部关键点识别、危险行为识别、车辆分割;3款产品能力升级包括:人体关键点识别、人流量统计、驾驶行为分析。更精细的关键点定位,将助力人机交互、互动娱乐等场景应用,而更丰富、精准的行为分析与识别能力,也将有效助力公共和交通安全。OCR方向,车牌、表格文字、通用文字(高精度/高精度含位置版)以及行驶证5款产品识别召回率均有不同程度的提升。同时人脸离线识别SDK升级至3.0版本,活体检测与通行全流程耗时低于300ms;人脸识别私有化部署包适配了最新的RTX系列2080显卡,并进一步提升模型性能。

EasyDL定制化模型训练与服务平台在数据标注、模型、服务部署三方面再度更新。在AI模型开发过程中,数据标注往往占据了一半以上的时间和金钱成本,而此次全新推出的智能标注,可节约70%的数据标注成本。例如在开发一个物体检测模型时,以5000张图片样本为例,在启动智能标注后,人工标注约30%的图片,剩余70%的图片机器自动完成标注,也就是说人工仅需标注1500张图片,相当于单模型可节约3000~40000元标注的成本。同时,EasyDL物体检测模型也迎来了进一步的升级,云服务时延和端SDK精度均有大幅提升。

AI模型在端上的落地应用往往伴随着复杂的硬件选型、软硬件适配,耗时耗力。为此,百度大脑本次推出了三款全新的硬件方案:EdgeBoard边缘AI计算盒、EasyDL开发套件(十目)、EdgeBoard全目标抓拍机,为终端应用场景提供最佳实践。EdgeBoard边缘AI计算盒,适用于多路视频、多模型、实时性要求高的本地计算场景,可灵活加载开发者自定义的模型,并联合EasyDL推出了软硬一体方案——EasyDL边缘AI计算盒(EdgeBoard),预置EasyDL专用SDK。EasyDL开发套件(十目)适用于小型终端设备、单模型实时处理场景;EdgeBoard多目标抓拍机实测可达55FPS,可灵活搭载视觉模型应用于安防监控、工业质检、气象监控等场景。目前,三款产品方案均已在百度AI市场上线。同时,EdgeBoard高性能计算卡本次活动上也面向开发者推出了直减1000元的活动,在边缘高性能计算场景为开发者提供更优惠的价格探索应用。

2

语音自训练平台在原有搜索模型、输入法模型的基础上,本次进一步支持了呼叫中心语音识别模型的自训练,支持智能客服场景实时语音识别和音频文件转写场景应用。智能创作平台也迎来了2.0版本的全新升级。

深度学习平台方面,源于产业实践的开源深度学习平台飞桨(PaddlePaddle)此次主要升级的内容包括:核心框架Paddle Fluid v1.5版本发布,PaddleNLP,PaddleCV,发布动态图,训练性能优化;工具组件PaddleHub新增29个预训练模型、发布图学习框架PGL Preview版。其中,PaddleNLP作为百度大脑工业级NLP开源工具与预训练模型集,具备了中文词法分析、文本情感分类等10项NLP应用任务,并且网络可灵活调整,场景也可高效迁移,具备业内领先的语义表示模型,可实现工业级的灵活应用,它也是当前业内最大的工业训练集。

AI Studio是基于飞桨(PaddlePaddle)的深度学习在线实训与教育平台,面向个人开发者提供在线编程环境、免费GPU算力、海量开源算法和开放数据,帮助开发者快速创建和部署模型,同时提供比赛环境, 供各路选手脱颖而出。AI Studio全新功能升级包括:上线图形化编程,可用图形拖拽方式构建模型训练过程,并生成可执行代码方便学习和调整;NoteBook在运行监控等方面也进行了体验升级;在算力方面,GPU下配套环境的CPU升至8核, 内存升至32GB。

为了帮助开发者更好地上手和应用深度学习技术, 百度大脑AI Studio亿元算力支持计划也在进一步扩容, 增加更多的计算资源。不论是一人一卡模式,还是远程集群模式,都将为开发者们提供大量的免费算力资源,普惠开发者, 以促进行业更好发展。同时,每年举办10余场赛事的百度AI Studio人工智能竞赛也在火热招募中,总奖金超百万元。

NLP技术领先 智能创作让内容创作者更轻松

百度大脑开放日第四期首次迎来NLP专场,百度自然语言处理部副总监忻舟为参会的开发者们详解了有关百度大脑NLP技术以及应用实践。央视网、国美零售、纵横文学的相关技术负责人也分别通过实际案例,与大家分享了企业如何通过百度大脑NLP能力的赋能,实现自身业务的智能化演进。

未标题-1

据忻舟在会上介绍,作为百度大脑开放AI能力的重要组成部分,百度大脑语言与知识技术拥有最大的多元语义知识图谱以及最好的中文语义表示模型,目前可提供30+项技术工具,囊括了文本审核、机器翻译、语言生成等多项能力,服务方式多样、灵活、可定制,含有多套场景技术方案。

现场还介绍了可持续学习语义理解框架ERNIE 2.0和基于此框架的ERNIE 2.0预训练模型。ERNIE2.0可通过建模海量数据中的词、实体及实体关系,学习真实世界的语义知识,目前累计学习超过10亿条知识,已在百度众多产品应用中显现效果。根据测试对比,ERNIE2.0在16个中英文任务上表现优于BERT和XLNet。

而此次重点介绍的智能创作平台2.0,正是集合了百度领先的自然语言处理知识图谱以及大数据技术,可实现自动创作、辅助创作等功能。具体而言,智能创作平台2.0在创作前,能够提供实时领域热点、地域热点信息,同时对TOP热点事件提供Topic实时热度分析;创作中,能够预置素材数据,提供多模素材推荐,同时进行实时智能纠错;创作后,能够自动审校、自动标签分类,生成自动摘要,提供用词润色建议及多模发布功能。整个创作过程可节约大概80%的时间。

央视网技术事业群副总经理朱立松在现场分享时表示:“当前传统视频生产运营面临着智能化生产、信息风险管控、内容创新等挑战,中央电视总台就人工智能赋能新媒体做出了大量的探索与尝试,而NLP技术是自动文摘、文本挖掘文本分类)、信息检索等AI应用的基础。” 朱立松还透露,央视网已经与百度合作,共建人工智能媒体研发中心,联合打造媒体产业人工智能产品,包括智能创作、智能分析、智能审核、智能搜索、智能推荐等。

国美零售控股国美管家技术总监高旭介绍,借助百度大脑NLP的情感倾向分析功能与评论观点抽取功能,国美上线了“服务评分智能化解决方案”,可自动分析用户评论并自动处理:“百度大脑在这套智能评分平台的效果准确率很高,现在国美客服运营人力需求从一天5人降低到3人,负面问题处理率从60%飙升至100%,售后师傅的差评率也整体降低了7%。” 

纵横文学产品总监张皓也肯定了百度大脑NLP对内容产业的价值。在接入了文本审核能力之后,机器初审替代人工评级,审核速度由每人每天60万字提升到600万字,并且对于风险内容和问题章节能够及时处理,只要两人就能完成。“百度大脑NLP文本审核的优点在于,词库、审核力度、监控维度都可以自定义,对内容平台管理而言相当灵活。”张皓说。

(从左至右:央视网技术事业群副总经理朱立松、国美管家技术总监高旭、纵横文学产品总监张皓)近年来,AI已经被广泛应用到各个领域,而NLP技术的发展让机器更懂人的语言和知识,不断的场景落地应用,也在进一步推动人机交互走向一个新的时代。在产业智能化的大时代背景下AI技术必须与千行万业、多种产业实体相结合,像润滑剂一样融入行业的生产核心领域,从而起到激发生产效率,为行业提质增效的目标。未来,百度大脑也将聚焦更多行业领域,通过AI技术在产业中的落地,推导出AI对社会经济的促进作用,最大化发挥AI技术价值与AI企业能动性。

产业百度大脑NLP智能物联网自然语言处理
1
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

信息检索技术

信息检索(IR)是基于用于查询检索信息的任务。流行的信息检索模型包括布尔模型、向量空间模型、概率模型和语言模型。信息检索最典型和最常见的应用是搜索引擎。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

文本分类技术

该技术可被用于理解、组织和分类结构化或非结构化文本文档。文本挖掘所使用的模型有词袋(BOW)模型、语言模型(ngram)和主题模型。隐马尔可夫模型通常用于词性标注(POS)。其涵盖的主要任务有句法分析、情绪分析和垃圾信息检测。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

机器翻译技术

机器翻译(MT)是利用机器的力量「自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)」。机器翻译方法通常可分成三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。

词法分析技术

词法分析是计算机科学中将字符序列转换为标记序列的过程。进行词法分析的程序或者函数叫作词法分析器,也叫扫描器。词法分析器一般以函数的形式存在,供语法分析器调用

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

自动摘要技术

自动摘要是指给出一段文本,我们从中提取出要点,然后再形成一个短的概括性的文本。

文本挖掘技术

文本挖掘有时也被称为文字探勘、文本数据挖掘等,大致相当于文字分析,一般指文本处理过程中产生高质量的信息。高质量的信息通常通过分类和预测来产生,如模式识别。文本挖掘通常涉及输入文本的处理过程,产生结构化数据,并最终评价和解释输出。'高品质'的文本挖掘通常是指某种组合的相关性,新颖性和趣味性。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

百度智能云机构

百度是全球最大的中文搜索引擎,是一家互联网综合信息服务公司,更是全球领先的人工智能平台型公司。2000年1月1日创立于中关村,公司创始人李彦宏拥有“超链分析”技术专利,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://www.baidu.com
推荐文章
暂无评论
暂无评论~