Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

开年大动作频频,百度大脑谋局2019释放出什么AI行业信号?

2018年是AI全面落地,成果颇丰的一年,2019年AI行业迈步向前的信心显得更加充足。近日,百度大脑一次性发布了数十项产品与技术的更新。看起来,作为AI行业的“头雁”,百度大脑这个开年来势汹汹,2019年要继续引领AI落地的积极性十足。

图片1.png

数十项更新,与推进AI落地、赋能合作伙伴的四个路径

图片2.png

AI能力的持续开放方面(增量),百度大脑开放平台目前已经开放150+AI能力。此次百度大脑在图像识别、人体分析、OCR、自然语言处理等方面都开放了新的AI能力,例如图像识别新增了车辆外观损伤识别,对租车公司、车险公司的定损有直接应用价值;极大便捷工作的OCR,则新增了对保单、税务局通用机打发票、行程单等的识别,OCR进一步延展。

既有AI模型优化方面(存量),百度大脑的图像识别、人脸识别、人体分析、自然语言处理开放能力都进行了提升。一方面,是模型的技术优化,例如在人证核验、考勤、门禁闸机等场景都有丰富应用价值的人脸离线识别SDK升级到了2.0,精度、速度等都有大幅度提升;另一方面,是易用度的提升,例如图库管理后台支持在线测试检索效果,不用调接口就能测试体验以图搜图的真实效果。

定制化平台与工具方面,百度大脑的“得意之作”——百度EasyDL定制化训练及服务平台本次进行了物体检测模型训练效率的提升,并新增实时查看模型训练进度、云服务调用数据功能,进一步强化合作开发者训练AI模型的效率和体验;此外,在理解与交互技术上(UNIT),新增电视剧场景查找等6个预置技能(累积已达23个),加上“技能复制”功能新增、小程序“UNIT对话测试助手”升级,开发者获取对应场景的智能对话能力变得更为轻松。

硬件产品与服务上,百度大脑除了新发布软硬一体的远场语音开发套件,支持需要语音交互的智能终端开方,还持续深化边缘计算布局,发布EdgeBoard终端计算加速方案,能大幅提升独立抓拍机(人脸或全目标)、多路视频计算小型服务器的边缘AI推理能力。

图片3.png

在整体解决方案上,百度大脑则发布了人脸考勤解决方案,将考勤功能集成到手机、摄像头等设备中,提升考勤效率,提高防作弊能力,这是图像识别能力整合的结果。

生态层面,“百度AI市场”本次宣布新增深圳视派尔、北京蚂蚁玖玖、北京文安智能、唐山莱锐思等多家优质服务商入驻,且按照电商业务机制进行了选购与交易过程的优化。

最后,百度大脑此次的大规模升级还将其“百度AI体验中心”的微信小程序进行了改造,语音识别得到优化,新增了人像分割、情绪识别、智能春联3项能力,普通C端用户也有机会尝试到更多“高大上”的百度AI技术。

回过头来看,多年耕耘后百度大脑开放平台已经形成了从深度学习框架、深度学习实训平台、通用AI能力、定制化训练平台、软硬一体模组到整体解决方案的全栈式开放平台,上述产品与技术更新与百度大脑开放平台各个层面都能予以对应,体现的是其作为领头羊多方位推进AI落地的尝试。

图片4.png

而视野放大从整个行业来看,百度大脑的一系列更新则厘清了推进AI落地、赋能合作伙伴的四个路径:

有客户“自选”的直接技术引用,如AI控制台直接提供使用的车辆分析、红酒识别、OCR等,可直接采购的人脸识别SDK等;

有为客户提供“自建”AI的平台或工具,如EasyDL定制化训练及服务平台,或远场语音开发套件,客户“自己动手”创造自己的AI模型,或者激发无限创意的消费级语音交互硬件;

有技术、产品之上整合打包的百度现成“套餐”,如人脸考勤解决方案,买来部署就能用,还提供各种升级售后;

还有服务模式的多级嵌套,不仅直接面对B端,也通过小程序面对C端打造AI形象;而百度AI市场则让服务B端的服务商进驻,实现天猫式的AI平台“电商”,B2B2B(百度AI to服务商to客户)的生态融汇。

四大路径推进AI落地,百度大脑做“头雁”姿态充足。

开年前后打出组合拳,百度大脑要更多角度强化“头雁”地位?

1月15日,新浪“2018科技风云榜”年度盛典上,百度获得新浪2018科技风云榜——年度AI技术推动公司奖项。该奖项直指百度表现出的大公司责任担当,不仅将自身AI化,更将AI技术平台化,让每个人都能简单快捷地使用AI技术。

在业界,百度“最AI”的认知已经树立,AI落地引擎的地位得到普遍认可。事实上,除了百度大脑开年这波技术&产品更新,百度在开年前后已有一系列AI相关的组合拳出击,其中可以发现百度AI谋局2019的路线图。

AI开放平台层面:例如前面所说各类AI技术开放、EasyDL和Unit定制化平台与工具、解决方案,展现出百度大脑以开放平台赋能各行各业的思路。

AI核心技术层面:1月16日,百度宣布语音技术取得技术突破,SMLTA模型将在线语音识别精度高位再提升了15%。AI是具备典型的飞轮效应,一旦技术飞轮转动到临界点,就会凭借AI领先实践的不断反哺形成后进者无法企及的领先度,百度的AI技术飞轮效应已经形成。

百度AI核心技术突破的同时,也促使产品颠覆性创新。1月16日,百度输入法“AI探索版”亮相,默认全语音输入,并调动表情、肢体等进行全感官输入,作为国内首款AI输入法开创了全感官输入2.0时代。而更多产品颠覆的口子,也被百度AI撕开了。

AI生态搭建层面:1月16日,AI硬件平台及产品发布会上,百度大脑发布了12项新产品和1项新服务,覆盖模型生产到产品售卖全层次链条。AI落地的一大关键是软硬件结合,目前百度大脑已有100多家硬件生态伙伴,同时“百度大脑硬件生态联盟“正式宣告启动;1月19日,百度黄埔学院——深度学习架构师培养计划举行开学典礼,35家来自AI应用企业的技术人才汇聚一堂,深度学习第一核心技术圈初现雏形;另一方面,作为促进AI产业链一站式上下游协作的全新机制百度AI市场持续引入优质服务商等

图片5.png

总的看来,百度大脑作为“头雁”,上述“三路出击”的组合拳,反映的其实也是AI开放平台们发展的大趋势:由战略布局下沉到战术实操。大战略、大概念、大布局阶段过去,AI开放平台开始偏向盯住具体的AI产品与技术,以及它们如何在更多场景下的应用,这就好像战场上各自排完兵布完阵,开始进入“白刃战”阶段。

AI注定改变一切,在那之前,2019年毫无疑问将是AI落地全面加速的一年,百度大脑已经走在前面。

曾响铃
曾响铃

1.钛媒体、品途商业评论等2016年度十大作者; 2.虎啸奖评委; 3. AI新媒体“智能相对论”创始人; 4.作家:【移动互联网+ 新常态下的商业机会】等畅销书作者; 5.《商界》《商界评论》《销售与市场》等近十家杂志撰稿人; 6.钛媒体、界面、虎嗅等近80家专栏作者; 7.“脑艺人”(脑力手艺人)概念提出者,现演变为“自媒体”,成为一个行业。 8.现为“今日头条问答签约作者”、多家科技智能公司传播顾问。

产业百度大脑深度学习
相关数据
字节跳动机构

北京字节跳动科技有限公司成立于2012年,是最早将人工智能应用于移动互联网场景的科技企业之一,是中国北京的一家信息科技公司,地址位于北京市海淀区知春路甲48号。其独立研发的“今日头条”客户端,通过海量信息采集、深度数据挖掘和用户行为分析,为用户智能推荐个性化信息,从而开创了一种全新的新闻阅读模式

https://bytedance.com
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

边缘计算技术

边缘运算(英语:Edge computing),又译为边缘计算,是一种分散式运算的架构,将应用程序、数据资料与服务的运算,由网络中心节点,移往网络逻辑上的边缘节点来处理。边缘运算将原本完全由中心节点处理大型服务加以分解,切割成更小与更容易管理的部分,分散到边缘节点去处理。边缘节点更接近于用户终端装置,可以加快资料的处理与传送速度,减少延迟。在这种架构下,资料的分析与知识的产生,更接近于数据资料的来源,因此更适合处理大数据。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

百度智能云机构

百度是全球最大的中文搜索引擎,是一家互联网综合信息服务公司,更是全球领先的人工智能平台型公司。2000年1月1日创立于中关村,公司创始人李彦宏拥有“超链分析”技术专利,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://www.baidu.com
文安智能机构

文安智能成立于2005年,是专注于人工智能视觉技术与产品研发的先行者,致力于为智慧城市和智慧商业打造端到端解决方案。 文安智能汇聚了由众多来自清华大学、中科院、微软研究院、IBM研究院等相关领域的行业专家组成的强大研发队伍。从人脸识别、行为识别、人群分析、车辆识别与分析等底层算法研发开始,文安智能自主研发了一系列AI视觉核心算法、高性能人工智能硬件平台与行业定制化智能解决方案。目前,公司产品与方案已经在国内外广泛应用,受到交通、综治、公安、商业地产、连锁零售等各行业客户的信赖与认可。

www.vion-tech.com
推荐文章
暂无评论
暂无评论~