CB Insights,网易智能来源龚力校对文婧 编辑

不看后悔!2019年人工智能行业的25大趋势

编者按:知名创投研究机构CB Insights调研了25种最大的AI趋势,以预测2019年该技术的下一步趋势,他们根据行业采用率和市场优势评估了每种趋势,并将其归类为必要性、实验性、威胁性、暂时性四类。


胶囊网络将挑战最先进的图像识别算法

1、开源框架(Open-Source Frameworks)

人工智能进入门槛比以往任何时候都低,这要归功于开源软件。2015年谷歌开放了其机器学习TensorFlow,越来越多的公司,包括Coca-Cola、e Bay等开始使用TensorFlow。2017年Facebook发布caffe2和 Py Torch(Python的开源机器学习平台),而Theano是蒙特利尔学习算法研究所(Mila)的另一个开源库,随着这些工具的使用越来越广泛,Mila公司已经停止了对Theano的开发。

2、胶囊网络(Capsule Networks)

众所周知,深度学习学习(Deep Learning)推动了今天的大多数人工智能应用,而胶囊网络(capsule networks)的出现可能会使其改头换面。深入学习界领航人Geoffrey Hinton在其2011年发布的论文中提到“胶囊”这个概念,于2017年-2018年论文中提出“胶囊网络”概念。

针对当今深度学习中最流行的神经网络结构之一:卷积神经网络(CNN),Hinton指出其存在诸多不足,CNN在面对精确的空间关系方面就会暴露其缺陷。比如将人脸图像中嘴巴的位置放置在额头上面,CNN仍会将其辨识为人脸。CNN的另一个主要问题是无法理解新的观点。黑客可以通过制造一些细微变化来混淆CNN的判断。

经测试,胶囊网络可以对抗一些复杂的对抗性攻击,比如篡改图像以混淆算法,且优于CNN。胶囊网络的研究虽然目前还处于起步阶段,但可能会对目前最先进的图像识别方法提出挑战。

3、生成式对抗网络(Generative Adversarial Networks)

2014年,谷歌研究员Ian Goodfellow提出“生成式对抗网络”(GAN)概念,利用“AI VS AI”概念,提出两个神经网络:生成器和鉴别器。谷歌DeepMind实习生Andrew Brock与其他研究人员一起合作,对Gans进行了大规模数据集的培训,以创建“BigGANs”。

GANs面对的主要挑战就是计算能力,对于AI硬件来说必须是并行缩放。研究人员用GANs进行“面对面翻译”,还有利用GANs将视频变成漫画形式,或者直接进行绘画创作等,但GANs也被一些不怀好意的人利用,包括制作假的政治录像和变形的色情制品。

4、联合学习(Federated Learnnig)

我们每天使用手机或平板会产生大量数据信息,如果使用这个本地数据集来训练AI算法可以极大地提高它们的性能,可是用户信息是非常私人和隐秘的。谷歌研发的联合学习(Federated Learning)方法旨在使用这个丰富的数据集,同时保护敏感数据。谷歌正在其名为Gboard的Android键盘上测试联合学习。

联合学习方法与其他算法的不同在于考虑了两个特征:非独立恒等分布(Non-IID)和不均衡性(Unbalanced)。联合学习已运用于搜索引擎Firefox、人工智能创业公司OWKIN等。

5、强化学习(Reinforcement Learning)

当谷歌DeepMind研发的AlphaGo在中国围棋游戏中击败世界冠军后,强化学习(Reinforcement Learning)获得了广泛关注。基于强化学习DeepMind接着又研发了AlphaGo Zero。UC Berkeley 研究人员利用计算机视觉强化学习来教授YouTube视频中的算法杂技技能。

尽管取得了进步,但强化学习与当今最流行的人工智能范式监督学习相比,还算不上成功,不过关于申请强化学习的研究越来越多,包括 Microsoft,Adobe,FANUC等。

2025年自动驾驶利润达800亿美元 物流率先应用

6、人工智能终端化

人工智能技术快速迭代,正经历从云端到终端的过程,人工智能终端化能够更好更快地帮助我们处理信息,解决问题,我们舍弃了使用云端控制的方法,而是将AI算法加载于终端设备上(如智能手机,汽车,甚至衣服上)。

英伟达(NVIDIA),高通(Qualcomm)还有苹果(Apple)等诸多公司加入了对终端侧人工智能领域的突破和探索,2017和2018年是众多科技公司在人工智能终端化进入快速发展期的两年,同时他们也在加紧对人工智能芯片的研发。但AI依然面临着储存和开发上的困境,亟需更丰富的混合模型连接终端设备与中央服务器。

7、人脸识别

从手机解锁到航班登机,人脸识别的应用范围愈发广泛,各国对于人脸识别的需求逐渐升高,不少创业公司开始关注这一领域,利用该技术,可以通过脸部特点从而还原蒙面嫌疑犯完整的人脸。但人脸识别仍有待改进。这一技术仍会对人脸真假存在误判。人脸识别中所包含的数据远比我们想象要多,其中的安全问题也应引起我们关注。

8、语言处理

自然语言处理(NLP)是人工智能的一个子领域,对于翻译技术而言,NLP就像一个潘多拉魔盒——除了丰富的市场机会,还有巨大的挑战。机器翻译就是其中一个等待开发的宝库,从后台自动化,客户支持,到新闻媒体,其应用广泛。

人机共生也是翻译领域未来的大方向,不少初创公司也期待从中分一杯羹,但要完成基于自然语言处理工作的翻译系统并不容易,单单中文里的各种方言和书面语就能把众多科技公司难住,据相关数据显示,除了热门的高资源语言,如中文,阿拉伯语,欧洲语言等,低资源语言和少数民族语言的开发和应用依然存在缺口。

9、车辆自动化驾驶

尽管自动化驾驶的汽车市场潜力巨大,但实现全自动的未来依然不明朗。自动化驾驶成为了科技公司和初创公司互相竞争的新领域,他们为此注入的不仅有新的活力,还有大量的投资。投资者对他们的决定十分乐观,数个自动驾驶汽车品牌所获得的投资总额已超百亿,预计2025年其市场利润能达800亿美元,物流等相关行业会成为首批应用全自动驾驶的行业,预计可缩减三分之一的成本。

10、AI聊天机器人

尽管许多人把聊天机器人看成是AI的代名词,但两者依然存在差别。如今的AI聊天机器人已经进化得十分完善,与真人对话时甚至还会应用“嗯...”这一类口头语和停顿,但人们担忧这些机器人的行为过于逼真,开始考虑在对话时对其聊天机器人的身份进行确认说明的需要。国外的科技巨头FAMGA(Facebook,Apple,Microsoft,Google与Amazon)以及国内的BAT都把目光投向了这一领域。

AI诊断前景巨大 制药巨头押注AI算法

11、医学成像与诊断

美国食品与药物管理局(FDA)正加速推进“AI即医疗设备”趋势。2018年4月,FDA批准了AI软件IDx-DR,它可以在不需要专家干预的情况下筛查糖尿病视网膜病变患者,准确率超过87.4%。FDA还批准了Viz LVO(可用于分析CT扫描结果以预测患者患中风危险)和Oncology AI套件(专注于发现肺部和肝脏病变),监管机构的快速审批为80多家AI成像和诊断公司开辟了新的商业道路。自2014年以来,这些公司共融资149笔。

在消费者方面,智能手机的普及和图像识别技术的进步正在把手机变成强大的家庭诊断工具,名为Dip.Io的应用使用传统尿液检测试纸来监测各种尿路感染。用户可以用智能手机给试纸拍照,计算机视觉算法会根据不同的光照条件和摄像头质量对结果进行校正。除此之外,许多“ML即服务”平台正集成到FDA批准的家庭监控设备中,发现异常时即可向医生发出警报。

12、下一代假肢

早期的研究正在兴起,结合生物学、物理学和机器学习来解决假肢面临的最困难问题之一,即灵活性。这是个十分复杂的问题,比如要让截肢者能够在假肢手臂上活动单个手指,需要解码其背后的大脑和肌肉信号,并将其转化为机器人控制指令,这些都需要多学科配合。最近,研究人员开始使用机器学习来解码来自人体传感器的信号,并将其转换成移动假肢设备指令。

还有些论文探讨了新媒介解决方案,比如使用肌电信号(残肢附近肌肉的电活动)来激活摄像头,以及运行计算机视觉算法来估计他们面前物体的抓取方式和大小。年度机器学习大会NeurIPS’18已经发起“AI假肢挑战赛”,进一步突显了AI社区对该领域的兴趣,2018年的挑战是使用强化学习预测假肢的性能,有442名参与者试图教AI如何跑步,赞助商包括AWS、英伟达以及丰田等。

13、临床试验患者招募

临床试验的最大瓶颈之一是招募合适的患者,苹果或许能够解决这个问题。尽管人们在努力将医疗记录数字化,但互操作性(在机构和软件系统之间共享信息的能力)仍是医疗保健领域最大的问题之一。理想的AI解决方案是从患者的病历中提取相关信息,并与正在进行的试验进行比较,为进行匹配研究的AI软件提供建议。

然而,像苹果这样的科技巨头已经成功地为他们的医疗保健计划引入了合作伙伴,苹果正在改变医疗数据的流动方式,并为AI开辟了新的可能性,尤其是围绕临床研究人员招募和监测患者的方式。自2015年以来,苹果推出了两个开源框架——ResearchKit和CareKit,以帮助临床试验招募患者,并远程监控他们的健康状况,消除了地理障碍,苹果还与Cerner和Epic等流行的EHR供应商合作,解决互操作性问题。

14、先进医疗生物识别技术

利用神经网络,研究人员开始研究和测量以前难以量化的非典型危险因素,使用神经网络分析视网膜图像和语音模式可能有助于识别心脏病的风险。比如,谷歌的研究人员使用受过训练的视网膜图像神经网络来发现心血管疾病的危险因素,如年龄、性别和吸烟等,梅奥诊所通过分析声音中的声学特征,可以发现冠心病患者的不同语音特征。

不久的将来,医疗生物识别技术将被用于被动监控,比如谷歌的专利希望通过肤色或皮肤位移来分析心血管功能,这些传感器甚至可能被放置在病人浴室的“感应环境”中,通过识别手腕和脸颊的皮肤颜色变化,用来确定心脏健康指标,如动脉僵硬或血压。亚马逊也申请了被动监测专利,将面部特征识别与心率分析结合起来。AI发现模式的能力将继续为新的诊断方法和识别以前未知的危险因素铺平道路。

15、药物发现

随着AI生物技术初创企业的兴起,传统制药公司正寻求AI SaaS初创企业为漫长的药物研发周期提供创新解决方案。2018年5月,辉瑞与XtalPi建立了战略合作伙伴关系,预测小分子药物的性质,开发“基于计算的理性药物设计”。诺华(Novartis)、赛诺菲(Sanofi)、葛兰素史克(GlaxoSmithKline)、安进(Amgen)和默克(Merck)等顶级制药公司,最近几个月都宣布与AI初创企业建立合作关系,以发现肿瘤和心脏病等领域的新药。

虽然像递归制药(Recursion Pharmaceuticals)这样的生物技术AI公司正在投资AI和药物研发,传统制药公司正在与AI SaaS初创公司合作。尽管这些初创公司中有许多仍处于融资的早期阶段,但它们已经拥有自己的制药客户。在药物研发阶段,成功的衡量标准很少,但制药公司正把数百万美元押在AI算法上,以发现新的治疗方案,并改变旷日持久的药物研发过程。

合成数据集用以解决AI的数据依赖

16、预测性维护

从制造商到设备保险公司,AI-IIoT可以在在故障损害发生之前,提出防范措施。现场和工厂设备会产生大量的数据,然而,未预料到的设备故障是制造业停机的主要原因之一。预测设备或单个部件何时失效将使资产保险公司和制造商受益。

在预测性维护中,传感器和智能摄像机收集来自机器的连续数据,如温度、压力等。实时数据的数量和变化形式使机器学习成为IIoT不可分割的组成部分。随着时间的推移,算法可以在故障发生之前预测可能出现的隐患。随着工业传感器成本的降低、机器学习算法的进步,以及对边缘计算的推动,预测性维护会更加广泛。

17、后台自动化

人工智能正在推动管理工作走向自动化,但数据的不同性质和格式使其成为一项具有挑战性的任务。根据行业和应用程序的不同,自动化“后台任务”的挑战可能是独一无二的,例如,手写的临床笔记对自然语言处理算法来说就是一个独特的挑战。机器人过程自动化(RPA)一直是热门话题,虽然并非所有的机器人过程自动化都基于机器学习,但许多都开始将图像识别和语言处理集成到它们的解决方案中。

18、综合训练数据

对于训练人工智能算法来说,访问大型的、标记的数据集是必要的,合成数据集可能会成为解决瓶颈问题的关键,人工智能算法依赖数据,当一些类型的现实世界数据不易被访问时,合成数据集的用武之地就体现出来,一个有趣的新兴趋势是使用AI本身来帮助生成更“逼真”的合成图像来训练AI,例如,英伟达使用生成对抗网络(GAN)来创建具有脑肿瘤的假MRI图像。GAN被用于“增强”现实世界数据,这意味着AI可以通过混合现实世界和模拟数据进行训练,以获得更大更多样化的数据集。此外,机器人技术是另一个可以从高质量合成数据中获益的领域。

19、网络优化

人工智能正在开始改变电信,电信网络优化是一套改进延迟、带宽、设计或架构的技术——能以有利方式增加数据流的技术,对于通信服务提供商来说,优化可以直接转化为更好的客户体验,除了带宽限制之外,电信面临的最大挑战之一是网络延迟,像手机上的AR / VR等应用,只有极低的延迟时间才能达到最佳的功能。

电信运营商也在准备将基于AI的解决方案集成到下一代无线技术中,即5G,三星收购了基于AI的网络和服务分析初创公司Zhilabs,为5G时代做准备,高通认为人工智能边缘计算是其5G计划的重要组成部分(边缘计算可减少带宽限制并与云进行频繁通信,这是5G的主要关注领域)。

20、网络威胁狩猎

对网络攻击做出反应已经不够了,使用机器学习主动“搜寻”威胁正在网络安全中获得动力。顾名思义,威胁搜寻是主动寻找恶意活动的做法,而不仅仅是在发生警报或违规后做出反应,狩猎开始于对网络中潜在弱点的假设,以及手动和自动化工具,以在连续的迭代过程中测试假设,网络安全中庞大的数据量使机器学习成为流程中不可分割的一部分,威胁狩猎很可能会获得更多的动力,然而它也面临着自身的一系列挑战,比如应对不断变化的动态环境和减少误报。

训练算法 指纹追踪 人工智能防范假货

21、电子商务搜索

对搜索词的上下文理解正在走出“实验阶段”,但要广泛采用搜索词还有很长的路要走,当使用电子商务搜索来显示相关结果时,使用适当的元数据来描述产品是一个起点。仅仅描述和索引是不够的,许多用户用自然语言搜索产品(比如“没有纽扣的洋红色衬衫”),或者不知道如何描述他们在寻找的商品,这使得电子商务搜索的自然语言成为一个挑战。

22、汽车索赔处理

保险公司和初创公司开始使用人工智能来计算车主的“风险得分”,分析事故现场的图像,并监控驾驶员的行为,Ant Financial在其“事故处理系统”中使用深度学习算法进行图像处理,过去,车主或司机会把他们的车送到“理算师”那里,理算师负责检查车辆的损坏情况,并记录下详细情况,然后将这些信息发送给汽车保险公司。如今,图像处理技术的进步使得人们可以拍下这辆车的照片并将其上传,神经网络对图像进行分析,实现损伤评估的自动化,另一种方法是对驾驶员进行风险分析,从而影响汽车保险的实际定价模型。

23、防伪

假货越来越难被发现,网购使得购买假货比以往任何时候都容易。为了反击,品牌和典当商开始尝试人工智能,在网络世界和现实世界两条战线上与假货作战。不过,网上假冒伪劣产品的范围和规模庞大复杂,造假者使用与原始品牌列表非常相似的关键词和图片,在假冒网站上销售假货,在合法市场上销售假货,在社交媒体网站上推广假货,随着“超级假货”或“aaa假货”的兴起,用肉眼分辨它们几乎变得不可能。

现在,建立一个假冒伪劣商品的数据库,提取其特征,并训练人工智能算法来分辨真伪,虽是一个繁琐的过程,但对于奢侈品牌和其他高风险零售商来说非常有必要,下一步的解决方案还可能是在实体商品上识别或添加独特的“指纹”,并通过供应链对其进行跟踪。

24、零售

走进一家商店,挑选你想要的东西,然后走出去,这几乎“感觉”就像在行窃,人工智能可以杜绝真正的盗窃行为,并让免结账手续零售变得更加普遍。盗窃一直是美国零售商的一大痛点,然而,当你掌握进出商店的人,并自动向他们收费时,有人入店行窃的可能性就会降到最低。其余一些需要考虑的事情是如何利用建筑空间,特别是在拥挤的超市,确保摄像机被最佳地放置来追踪人和物品。

在短期内,问题将归结为部署成本和由潜在技术故障造成的库存损失成本,以及零售商能够承担这些成本和风险的程度。

25、农作物监测

无人机可以为农民绘制农田地图,利用热成像技术监测湿度,识别虫害作物并喷洒杀虫剂。

初创公司正专注于为第三方无人机捕获的数据添加分析。还有人使用计算机视觉使地面上的农业设备变得更智能,按照需要喷洒个别作物,就会减少对非选择性除草剂的需求,而非选择性除草剂会杀死附近的一切,精确喷洒意味着减少除草剂和杀虫剂的使用量。在实地调查之外,利用计算机视觉分析卫星图像提供了对农业实践的宏观理解,地理空间数据可以提供关于全球作物分布模式和气候变化对农业影响的信息。

THU数据派
THU数据派

THU数据派"基于清华,放眼世界",以扎实的理工功底闯荡“数据江湖”。发布全球大数据资讯,定期组织线下活动,分享前沿产业动态。了解清华大数据,敬请关注姐妹号“数据派THU”。

产业无人机医学影像聊天机器人自然语言处理人脸识别自动驾驶强化学习生成对抗网络联合学习图像识别胶囊网络CB Insights
33
相关数据
AWS机构

亚马逊网络服务系统(英语:Amazon Web Services,缩写为AWS),由亚马逊公司所创建的云计算平台,提供许多远程Web服务。Amazon EC2与Amazon S3都架构在这个平台上。在2002年7月首次公开运作,提供其他网站及客户端(client-side)的服务。截至2007年7月,亚马逊公司宣称已经有330,000名开发者,曾经登录过这项服务。

相关技术
亚马逊机构

亚马逊(英语:Amazon.com Inc.,NASDAQ:AMZN)是一家总部位于美国西雅图的跨国电子商务企业,业务起始于线上书店,不久之后商品走向多元化。目前是全球最大的互联网线上零售商之一,也是美国《财富》杂志2016年评选的全球最大500家公司的排行榜中的第44名。

https://www.amazon.com/
相关技术
高通机构

高通公司(英语:Qualcomm,NASDAQ:QCOM)是一个位于美国加州圣地亚哥的无线电通信技术研发公司,由加州大学圣地亚哥分校教授厄文·马克·雅克布和安德鲁·维特比创建,于1985年成立。两人此前曾共同创建Linkabit。 高通公司是全球3G、4G与5G技术研发的领先企业,目前已经向全球多家制造商提供技术使用授权,涉及了世界上所有电信设备和消费电子设备的品牌。根据iSuppli的统计数据,高通在2007年度一季度首次一举成为全球最大的无线半导体供应商,并在此后继续保持这一领导地位。其骁龙移动智能处理器是业界领先的全合一、全系列移动处理器,具有高性能、低功耗、逼真的多媒体和全面的连接性。目前公司的产品和业务正在变革医疗、汽车、物联网、智能家居、智慧城市等多个领域。

DeepMind机构

DeepMind是一家英国的人工智能公司。公司创建于2010年,最初名称是DeepMind科技(DeepMind Technologies Limited),在2014年被谷歌收购。在2010年由杰米斯·哈萨比斯,谢恩·列格和穆斯塔法·苏莱曼成立创业公司。继AlphaGo之后,Google DeepMind首席执行官杰米斯·哈萨比斯表示将研究用人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸II》(StarCraft II)。深度AI如果能直接使用在其他各种不同领域,除了未来能玩不同的游戏外,例如自动驾驶、投资顾问、音乐评论、甚至司法判决等等目前需要人脑才能处理的工作,基本上也可以直接使用相同的神经网上去学而习得与人类相同的思考力。

深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

自动驾驶汽车技术

自动驾驶汽车,又称为无人驾驶汽车、电脑驾驶汽车或轮式移动机器人,是自动化载具的一种,具有传统汽车的运输能力。作为自动化载具,自动驾驶汽车不需要人为操作即能感测其环境及导航。

边缘计算技术

边缘运算(英语:Edge computing),又译为边缘计算,是一种分散式运算的架构,将应用程序、数据资料与服务的运算,由网络中心节点,移往网络逻辑上的边缘节点来处理。边缘运算将原本完全由中心节点处理大型服务加以分解,切割成更小与更容易管理的部分,分散到边缘节点去处理。边缘节点更接近于用户终端装置,可以加快资料的处理与传送速度,减少延迟。在这种架构下,资料的分析与知识的产生,更接近于数据资料的来源,因此更适合处理大数据。

TensorFlow技术

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

机器翻译技术

机器翻译(MT)是利用机器的力量「自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)」。机器翻译方法通常可分成三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

卷积神经网络技术

卷积神经网路(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网路由一个或多个卷积层和顶端的全连通层(对应经典的神经网路)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网路能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网路在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网路,卷积神经网路需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。 卷积网络是一种专门用于处理具有已知的、网格状拓扑的数据的神经网络。例如时间序列数据,它可以被认为是以一定时间间隔采样的一维网格,又如图像数据,其可以被认为是二维像素网格。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

监督学习技术

监督式学习(Supervised learning),是机器学习中的一个方法,可以由标记好的训练集中学到或建立一个模式(函数 / learning model),并依此模式推测新的实例。训练集是由一系列的训练范例组成,每个训练范例则由输入对象(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)。

聊天机器人技术

聊天机器人是经由对话或文字进行交谈的计算机程序。能够模拟人类对话,通过图灵测试。 聊天机器人可用于实用的目的,如客户服务或资讯获取。有些聊天机器人会搭载自然语言处理系统,但大多简单的系统只会撷取输入的关键字,再从数据库中找寻最合适的应答句。

无人机技术

无人机(Uncrewed vehicle、Unmanned vehicle、Drone)或称无人载具是一种无搭载人员的载具。通常使用遥控、导引或自动驾驶来控制。可在科学研究、军事、休闲娱乐用途上使用。

图像处理技术

图像处理是指对图像进行分析、加工和处理,使其满足视觉、心理或其他要求的技术。 图像处理是信号处理在图像领域上的一个应用。 目前大多数的图像均是以数字形式存储,因而图像处理很多情况下指数字图像处理。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

生成对抗网络技术

生成对抗网络是一种无监督学习方法,是一种通过用对抗网络来训练生成模型的架构。它由两个网络组成:用来拟合数据分布的生成网络G,和用来判断输入是否“真实”的判别网络D。在训练过程中,生成网络-G通过接受一个随机的噪声来尽量模仿训练集中的真实图片去“欺骗”D,而D则尽可能的分辨真实数据和生成网络的输出,从而形成两个网络的博弈过程。理想的情况下,博弈的结果会得到一个可以“以假乱真”的生成模型。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

OK
资本驱动科技成果转化
XtalPi员工打卡 我司牛逼!