Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

科技向令说来源

从百度与IDC发布的白皮书,看超乎想象的AI大趋势

有人说互联网开始由黄金时代转入白银时代,但AI可能与此相反,初创期的“白银时代”已经向产业应用全面落地的“黄金时代”进发。

12月20日,国际数据公司(IDC)与百度AI产业研究中心(BACC)联合发布《百度大脑领导力白皮书》。该白皮书按官方说法意在“洞察AI趋势,激发产业新效能”,在开篇着重预测了2019年中国AI市场发展的十大趋势。

解构该白皮书,我们发现,未来AI的发展在很多地方都将超出现有预期。

AI带来的便捷,将比你想得还要极致

AI给产业和生活带来了无与伦比的便捷,而未来AI带来的便利将比你想象的还要更进一步。

1、部署AI,代码都不想敲?那就点几下鼠标吧

云计算巨头的支撑下,企业自己部署AI即将摆脱过去那种全靠码农一行行代码敲出模型的境况,用少量的引导代码就能部署完整、可用、高效的算法模型。

不过,这还没有结束,那些对AI需求相对固定、大众化的企业,甚至可以“懒”到连少量代码都不用敲,直接在专业开发平台上点几下鼠标就能实现AI部署自动化,像访问WEB一样便捷。由此,“普惠AI”将不再是一个概念。

类似的开发平台不断涌现,典型的如谷歌AutoML、百度EasyDL等。例如,在EasyDL上,用户可以上传图片、音频、文本等原始数据,系统可自动训练出合适的模型,以图像分类为例,训练数据每类仅需20-100张图片,最快10分钟可训练完毕。

2、不光人想变得更懒,机器也是

在AI之前IT信息化已经大行其道,财务、人力等的IT化让人可以更“懒”更轻松。但是,过去的IT信息化本质上只是把人要做的事由机器去执行(进行了一定的流程重构)。

现在,智能化使得业务流程再度重构,某种程度上,机器也变得“更懒”,凭借AI模型只需要少量的步骤就能完成过去IT信息化系统要做的工作。

IDC预计至2023年,AI将取代50%的IT业务工作量,节省20%以上的运营成本。在已有的实践案例中,太平洋保险和百度合作,在车险理赔环节采用AI技术(原有IT信息化支撑),每年预计将节省2-3亿元运营成本。在车险理赔中,超过70%的车险理赔都是5000元以下的小额碰擦事故,而整体赔付金额只占到20%多,这十分适合AI的介入。

3、不能随心所欲的智能交互都是伪命题

智能音箱现在十分流行,它代表人机交互界面的智能化趋向,即摆脱屏幕的束缚,让交互通过语音的方式实现。

人和人之间获取和交互信息,可通过说话、读文字、对眼神、浏览照片、播放视频等多种方式,这些,正是AI加持交互的最终目标。智能音箱只是开始,那些人与机器的交互,将通过AI实现“随心所欲”不被时间、设备、场所所桎梏。

在这之前,至少要先摆脱屏幕。IDC预计到2023年,支持AI的人机交互接口将取代目前50%的基于屏幕的B2B和B2C的应用程序。在融合语音、图像、视频以及语义理解能力的AI能力不断进化时,有理由相信,未来人与机器的交互将“心有灵犀”,而不是只靠冰冷的电容屏。

AI已经很聪明了?对,但它还能比你想象的聪明更多

除了产业与生活的便捷化,AI自己在也变得更“聪明”,甚至比我们想象的AI要聪明得多。

1、全能型选手马上要成型了

李开复曾经对AI落地场景有过直白的观点——金融行业会是最好、最先落地AI的场景。时至今日,Fintech领域的AI应用的确大放异彩,金融风控成为AI落地的典型产品。同时,在政府行业、互联网行业,AI近年来的实践也突飞猛进,城市治理、政务ATM背后都有AI的身影,连我们平时点个外卖,小哥如何配送背后都存在着AI路径优化。

不止于此,按照IDC与百度的预测,除了上述三个行业的全面扩展,新零售、新制造、医疗领域也将成为AI市场的新增长点。这六大行业未来应用AI的3年复合增长率将超过30%。

例如,广州妇女儿童医疗中心已于2年前开始全面探索AI的应用,包括在电子病历系统中应用语音识别帮助撰写,利用图像识别、深度学习技术进行智能阅片辅助诊断,此外,还有病种分析、影像报告文书撰写、智能导诊、临床辅助诊断等多个AI应用场景落地。

而这些,还只是AI的典型应用,在更多领域AI也在崛起。.

2、不只是知其然,还要知其所以然

过去及当前某些AI技术,还处在只能听清、看清的“知其然”状态,而信息到底想表达什么,AI其实是不懂的。就好像用AI语音听写一段话,它能准确地翻译出来而不用用户打字,但这句话究竟是什么用意AI并不知道,或者说,需要换用另一个AI算法来实现。

这显然是不够的。在IDC与百度发布的报告中,多模态计算会成为下一步的技术趋势。

按百度高级副总裁王海峰的说法,机器智能不仅仅能够“看清听清”,还要能够“看懂听懂”。由此,融合视觉、语音、语义及情感的多模态计算成为必然,其结果,是AI更能深入理解信息背后的含义,进而更好地支撑各种应用。

例如,服务快消品行业的惠合科技接入百度EasyDL进行陈列审核,旗下e店佳应用上传陈列视频,EasyDL以定制化的物体检测能力来识别商品是什么,同时还能推演出图片中该类型商品的陈列究竟是否符合要求。目前,该图像识别已经应用至40000家零售门店,这背后,就是多模态计算的价值呈现。

3、不管什么类型数据,只要有需求AI随时“效命”

数据是AI算法模型的原料,一个算法对应一种结构化数据,要是数据不匹配算法便不能很好运行甚至出错。

然而,很多企业的数字化转型过程中,物理世界到虚拟数字多数时候并不能成为结构化数据,它们类型多样、形式复杂。例如,制造业机械维保往往有零件或组件名称、序列号、制造商信息、维护间隔、维护日期、分包商信息、手册和文档的链接、联系人、保修和服务合同信息等非结构化数据,十分“丰富”。

这些非结构化数据带来庞大的AI计算需求,在它们应用到AI算法之前,需要有多模型数据库的支撑,什么都能往里边塞,AI通过这样的数据库什么都能“算”。由此,在迫切需求的支撑下,所谓多模型数据库开始走向市场,IDC预计到2023年,多模型数据库的支出将达到NoSQL数据库(一种当前兴起的主流数据库形态)支出的30%。

产业化、生态化,AI的玩法还要多几分“意外”

从AI产业化、生态化的商业玩法上看,AI的趋势也有些令人“意外”,过去某些玩法出现“反转”。

1、人人AI不再是憧憬了

IDC预计,传统行业中的大中型企业到2020年行业前15%的企业都将采用机器学习。这意味着,AI不再是高高在上的时髦技术,几年内就就将“飞入寻常百姓家”,而越是传统行业就越发积极,价值体现也更为明显。

空调制造巨头美的,用图像识别技术通过监测空调外观来保证空调出厂质量;专业服务制造业“检测”的领邦智能,基于百度PaddlePaddle框架训练深度学习模型,能够高效准确地识别出问题零件及其种类,精度与人工检测持平,成本节约15%以上;代工巨头富士康更不用说,每年将收入的2%-5%用于AI的研究。目前,在模具生产中,富士康建立了基于深度学习的模型算法,实现刀具更换提前预警、自动补偿,人力成本投入进一步减少。

目前中国正面临着人工智能技术产业化以及传统产业智能化的最佳机遇,能否抓住新机遇帮助企业建立核心竞争优势取决于企业如何行动。白皮书指出,百度大脑3.0技术能力已进入“多模态深度语义理解”阶段,已经开放能力超140项,每日调用次数超过4000亿次。除了开放AI技术能力之外,在生态方面,百度大脑推出了燎原计划,对合作伙伴提供商业落地所需的市场与运营资源,全力支持生态共赢 。在智能硬件和设备领域,百度大脑与芯片、嵌入式开发板、传感器模组,以及闸机、门禁、机器人等厂商广泛建立合作,帮助客户获得软硬件适配更加整合的方案。百度大脑还创新性地推出了AI市场,为合作伙伴提供品牌营销、产品评测、产品推荐等全套服务,旨在为合作伙伴带来更多优质的订单。同时,百度大脑的行业创新合伙人计划在每个细分领域最多选择3家企业,与百度大脑联合设计、开发,共同打造行业解决方案,推动产品落地。

2、AI不再“深居云端”,边缘也需要“AI一下”

由于百度云等云计算玩家的引领,过去云计算应用都偏向于云端部署。不过,随着物联网的深度发展,靠近数据源的端侧设备的AI部署将盛行起来。

用大白话说,过去是数据统一汇总到云端统一运算,现在,那些终端设备(例如终端摄像头、温度传感器等)将进行必要的计算(物品识别、人脸识别等),云端只负责统筹式的数据运算。

例如,百度云的“天工”就是针对智能物联网的云平台产品,其主要特点之一是可以实现“智能边缘”——端计算、云管理、端云融合,在工业、物流、车联网、家居、城市等物联网领域都能够被应用。腾讯云、阿里云等也有类似的产品,IDC预计至2022年,25%的物联网端设备都将运行AI算法模型。

3、软硬件的协作,这回不只有硬件说了算

过去,AI的计算是建立在已有的硬件基础上,例如intel已经成型CPU,或者Nvidia本来用于画图或游戏的GPU。有什么硬件就用什么硬件,硬件决定软件计算能力。

不过,这个状况正在被改变,软硬件的关系以后将逐步走向协同,软件定义计算已成为芯片厂商的重要战略之一,软件及应用驱动AI专用芯片的阶段也将到来。

7月,百度发布“昆仑”AI芯片,每秒运算260万亿次,这远远超过Nvidia的GPU进行AI运算的效能。显然,“昆仑”的基础架构建立在机器学习、AI应用趋势的基础之上。此外,华为在手机芯片中植入的NPU模块,以及刚刚发布不久的Ascend 310独立AI芯片,都遵循同样的玩法。

4、所谓生态参与者越来越多,想做“平台”挑战越来越明显

开放一直是AI大佬级企业做生态的标配,BAT皆是如此,只是开放的程度和姿态不一样,有些啥都开放强调共赢,有些强调控制,有些只管投资收益。

做AI平台生态过去就是笼络一大批需要AI技术加持的企业,建立合作关系、输出AI能力,谁能获得的合作伙伴越多、类型越丰富,谁的生态就最“扎眼”。

然而,正如上文所说,AI技术正在向端侧智能渗透,且软硬件需要高度适配,于是平台在整合生态的过程中,不仅仅需求合作伙伴的数量和种类,在产业链方面的要求更为严苛。以物联网领域为例,平台的AI生态不仅仅只有需求方(例如制造企业),还需要与传感器、摄像头、模组这些上游企业就AI的应用达成一致,一些时候芯片也需要改造或重建。

产业链上的细分产业的整合愈加重要,未来的AI生态平台将是网状结构的,百度等AI大佬要稳坐钓鱼台,挑战会更大,而一旦这样的生态建立起来,护城河也将更宽更深。

曾响铃
曾响铃

1.钛媒体、品途商业评论等2016年度十大作者; 2.虎啸奖评委; 3. AI新媒体“智能相对论”创始人; 4.作家:【移动互联网+ 新常态下的商业机会】等畅销书作者; 5.《商界》《商界评论》《销售与市场》等近十家杂志撰稿人; 6.钛媒体、界面、虎嗅等近80家专栏作者; 7.“脑艺人”(脑力手艺人)概念提出者,现演变为“自媒体”,成为一个行业。 8.现为“今日头条问答签约作者”、多家科技智能公司传播顾问。

产业百度
1
相关数据
华为机构

华为创立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。

https://www.huawei.com/cn/
字节跳动机构

北京字节跳动科技有限公司成立于2012年,是最早将人工智能应用于移动互联网场景的科技企业之一,是中国北京的一家信息科技公司,地址位于北京市海淀区知春路甲48号。其独立研发的“今日头条”客户端,通过海量信息采集、深度数据挖掘和用户行为分析,为用户智能推荐个性化信息,从而开创了一种全新的新闻阅读模式

https://bytedance.com
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

重构技术

代码重构(英语:Code refactoring)指对软件代码做任何更动以增加可读性或者简化结构而不影响输出结果。 软件重构需要借助工具完成,重构工具能够修改代码同时修改所有引用该代码的地方。在极限编程的方法学中,重构需要单元测试来支持。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

云计算技术

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

流数据技术

流数据是一组顺序、大量、快速、连续到达的数据序列,一般情况下,数据流可被视为一个随时间延续而无限增长的动态数据集合。应用于网络监控、传感器网络、航空航天、气象测控和金融服务等领域。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

图像分类技术

图像分类,根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

推荐文章
暂无评论
暂无评论~