2018年机器学习和人工智能的主要发展有哪些?2019年会有哪些趋势?

2018年即将结束,著名数据科学网站KDnuggets向众多机器学习和AI专家征求关于2018年最重要的发展及其2019年关键趋势预测的意见,向他们提出了一个问题:

2018年机器学习人工智能的主要发展是什么?您期望在2019年出现哪些关键趋势?

这些专家挑选出的关键主题包括深度学习的进步、机器学习的局限性,自然语言处理不断变化的环境、transfer learning等等。

以下是Anima Anandkumar、Andriy Burkov、Pedro Domingos、Ajit Jaokar、Nikita Johnson、Brandon Rohrer、Elena Sharova的回答。

Anima Anandkumar 

NVIDIA的ML研究主任和Caltech的Bren教授

2018年总结—“低学习的深度学习成果大部分都是采摘过的”

焦点开始从标准的监督学习转向更具挑战性的机器学习问题,如半监督学习、领域适应、主动学习生成模型GAN继续受到研究人员的欢迎,他们正在尝试更加艰巨的任务,如照片真实感(bigGAN)和视频到视频合成。开发了替代的生成模型(例如神经渲染模型)以在单个网络中组合生成和预测以帮助半监督学习研究人员将深度学习的应用扩展到许多科学领域,如地震预测、材料科学、蛋白质工程、高能物理和控制系统。在这些情况下,领域知识和约束与学习相结合。例如,为了改善无人机的自主着陆。

2019年预测—“人工智能将模拟和现实联系起来,变得更安全,更具物理意识”

我们将看到开发新的领域适应技术,以便将知识从模拟无缝转移到现实世界。使用模拟将有助于我们克服数据稀缺性并加快新领域和问题的学习。使AI从模拟到实际数据(Sim2real)将对机器人技术、自动驾驶、医学成像和地震预报等产生重大影响。模拟是解决自动驾驶等安全关键应用中所有可能情况的好方法。内置于复杂模拟器中的知识将以新颖的方式使用,以使AI更具物理意识,更强大,并能够推广到新的和看不见的场景。

Andriy Burkov

Gartner的机器学习团队负责人

这是他作为一名实践者的看法,而不是Gartner基于研究的官方声明。

2018年机器学习人工智能的主要发展是什么?

TensorFlow在学术界输给了PyTorch,有时谷歌的巨大影响力和影响力可能会使市场处于次优的状态,因为MapReduce和随后的hadoop狂热已经发生了这种情况。Deepfakes(及其与声音相似)粉碎了最值得信赖的信息来源:视频片段。没有人能再说出这样的话:我看到那个人说出这些话的视频,几十年前我们不再相信印刷文字,但直到现在,视频还是不可动摇。强化学习深度学习的形式回归是非常意外和酷的!Google代表您致电餐厅并假装(成功)成为真正的人类的系统是一个非常里程碑。然而,它引发了许多关于道德和人工智能的问题。个人助理和聊天机器人很快就达到了极限,他们比以往任何时候都好,但不如去年所希望的那么好。

您对2019年期望的主要趋势是什么?

  1. 我希望每个人都对今年的AutoML承诺感到兴奋。我也期望它失败(除了一些非常具体和明确定义的用例,如图像识别、机器翻译文本分类,其中手工制作的功能不需要或是标准的,原始数据接近于机器期望作为输入,并且数据是丰富的)。

  2. 营销自动化:利用成熟的生成对抗网络和变分自动编码器,可以生成数千张相同人物或图像的图片,这些图像之间的面部表情或情绪差异很小。根据消费者对这些图片的反应,我们可以制作出最佳的广告活动。

  3. 移动设备上的实时语音生成与真实人类无法区分。

  4. 自动驾驶的出租车将保持在测试/ PoC阶段。

Pedro Domingos

华盛顿大学计算机科学与工程系的教授

经过多年的炒作,2018年间,大家对人工智能过度恐惧。听媒体甚至是一些研究人员说了以后,你会认为剑桥分析公司干扰了2016年的大选结果,机器人正在接受我们的工作,然后是我们的生活。不仅仅是谈话,欧洲和加利福尼亚州已经通过了严厉的隐私法,联合国正在就智能武器禁令等进行辩论。公众对人工智能的看法越来越暗,这既危险又不公平。希望2019年将是理智回归。

Ajit Jaokar

牛津大学物联网课程的首席数据科学家和创造者

2018年,一些趋势开始发展,自动机器学习是一个,强化学习是另一个。这两个新生趋势将在2019年大幅扩展。作为我在牛津大学(物联网数据科学课程)教学的一部分,我看到物联网越来越多地融入大型生态系统,如自动驾驶汽车、机器人和智能城市。通过与Dobot的合作,我看到了一种新的机器人技术,即协同机器人(cobots)作为2019年的一个关键趋势。它与之前的装配线机器人不同,新的机器人将能够自主并且也能理解情感(在我的课程中我们也与情感研究实验室合作在这方面)。最后,有一个有争议的观点:在2019年,我们所知道的数据科学家的角色将倾向于从研究转向产品开发。我认为人工智能与下一代数据产品的创建密切相关,数据科学家的角色将相应改变。

Nikita Johnson

RE.WORK的创始人

我们在2018年目睹的一个发展是开放源工具数量的增加,这些工具降低了进入门槛,使所有人都能更容易地访问AI,以确保加强组织之间的协作。这些社区对于确保人工智能在社会和企业的所有领域的传播至关重要。

同样,在2019年,我们将看到关注“人工智能”的公司数量有所增加,这是基于谷歌最近宣布的“AI for Social Good program计划“,以及微软的”AI for Good计划“。随着社会要求公司拥有更高的社会目标,这种将人工智能转化为积极影响的行为正在获得牵引力。

Brandon Rohrer

Facebook的数据科学

2018年机器学习人工智能的主要发展是什么?

2018年的一个重要发展是数据科学教育机会的扩散和成熟。在线课程是原始的数据科学教育场所,它们在各个层面继续受欢迎,每年都有更多的学生、变体和主题。

在学术界,新的数据科学硕士课程正以每年约十几个的速度开始。我们的高等院校正在响应公司和学生的请求,为数据相关领域提供专门的计划。(今年,我和18位行业合作者,11位学术贡献者,创建了一个虚拟行业顾问委员会,以帮助支持这种爆炸式增长。)在非正式的一端,教程博客文章无处不在。它们为读者和作者的数据科学的集体理解做出了巨大贡献。

您对2019年期望的主要趋势是什么?

在2019年及以后,学术数据科学计划将成为收集第一个数据科学职位所需的基线技能的更常见方式。这是件好事。受认证的机构将填补长期的空白。到目前为止,数据科学资格已经在很大程度上通过以前的工作经验证明。这会创建一个Catch-22。新数据科学家无法展示他们的资格,因为他们从未有过数据科学工作,他们无法获得数据科学工作,因为他们无法展示他们的资格。教育机构的证书是打破这一循环的一种方式。

Elena Sharova

ITV的高级数据科学

2018年机器学习人工智能的主要发展是什么?

在我看来,2018年将通过以下三个事件在AI和ML社区中被记住。

首先,欧盟全球数据保护条例(GDPR)的开始旨在提高个人数据使用的公平性和透明度。该规定揭示了个人控制其个人数据和获取其使用信息的权利,但也引起了对法律解释的一些混淆。迄今为止的最终结果是,许多公司认为自己是合规的,对数据处理做了一些表面上的改变,忽略了重新设计数据存储和处理基础设施的基本需求。

其次,还有剑桥Analytica丑闻,它给整个数据科学(DS)社区蒙上阴影。如果之前的辩论主要是关于确保AI和ML产品的公平性,那么这个丑闻就会引发更深层次的伦理问题。对Facebook参与的最新调查意味着它不会很快消失。随着数据科学领域的成熟,这些发展将在许多行业中发生,超越政治。有些人会更悲惨,比如亚利桑那州的Uber自驾车案他们之后会受到强烈反响的公众反应。技术就是力量,力量就是责任。正如诺姆乔姆斯基所说:“只有在民间故事,儿童故事和知识分子的期刊中才能明智地使用权力来摧毁邪恶。现实世界教导了非常不同的课程,并且需要故意和专注的无知才能感知到它们。“

最后,从更积极的方面来看,亚马逊最新开发的自己的服务器处理器芯片意味着我们可能会越来越接近云计算的一般访问不再是成本问题。

您对2019年期望的主要趋势是什么?

数据科学家的角色和职责不仅仅是建立能够实现准确预测的模型。对于ML、AI和DS从业者而言,2019年的主要趋势将是遵循既定软件开发实践的日益增长的责任,特别是在测试和维护方面。数据科学的最终产品必须与公司技术堆栈的其余部分共存。有效运行和维护专有软件的要求将适用于我们构建的模型和解决方案。这意味着最好的软件开发实践将支持我们需要遵循的机器学习规则。

信息来源:https://www.kdnuggets.com/2018/12/predictions-machine-learning-ai-2019.html

AMiner学术头条
AMiner学术头条

AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。系统2006年上线,吸引了全球220个国家/地区800多万独立IP访问,数据下载量230万次,年度访问量1000万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。

https://www.aminer.cn/
专栏二维码
产业强化学习半监督学习自动驾驶监督学习自然语言处理深度学习机器学习
1
相关数据
亚马逊机构

亚马逊(英语:Amazon.com Inc.,NASDAQ:AMZN)是一家总部位于美国西雅图的跨国电子商务企业,业务起始于线上书店,不久之后商品走向多元化。目前是全球最大的互联网线上零售商之一,也是美国《财富》杂志2016年评选的全球最大500家公司的排行榜中的第44名。

https://www.amazon.com/
相关技术
微软机构

微软是美国一家跨国计算机科技公司,以研发、制造、授权和提供广泛的计算机软件服务为主。总部位于美国华盛顿州的雷德蒙德,最为著名和畅销的产品为Microsoft Windows操作系统和Microsoft Office办公室软件,以及Xbox的游戏业务。微软是美国《财富》杂志2015年评选的世界500强企业排行榜中的第95名。

https://www.microsoft.com/en-us/about
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

半监督学习技术

半监督学习属于无监督学习(没有任何标记的训练数据)和监督学习(完全标记的训练数据)之间。许多机器学习研究人员发现,将未标记数据与少量标记数据结合使用可以显着提高学习准确性。对于学习问题的标记数据的获取通常需要熟练的人类代理(例如转录音频片段)或物理实验(例如,确定蛋白质的3D结构或确定在特定位置处是否存在油)。因此与标签处理相关的成本可能使得完全标注的训练集不可行,而获取未标记的数据相对便宜。在这种情况下,半监督学习可能具有很大的实用价值。半监督学习对机器学习也是理论上的兴趣,也是人类学习的典范。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

数据科学技术

数据科学,又称资料科学,是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。

文本分类技术

该技术可被用于理解、组织和分类结构化或非结构化文本文档。文本挖掘所使用的模型有词袋(BOW)模型、语言模型(ngram)和主题模型。隐马尔可夫模型通常用于词性标注(POS)。其涵盖的主要任务有句法分析、情绪分析和垃圾信息检测。

自动驾驶汽车技术

自动驾驶汽车,又称为无人驾驶汽车、电脑驾驶汽车或轮式移动机器人,是自动化载具的一种,具有传统汽车的运输能力。作为自动化载具,自动驾驶汽车不需要人为操作即能感测其环境及导航。

TensorFlow技术

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

机器翻译技术

机器翻译(MT)是利用机器的力量「自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)」。机器翻译方法通常可分成三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。

MapReduce技术

MapReduce,一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(归约)",是其主要思想,皆从函数式编程语言借用。它还借用了矢量编程语言的特性。它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。 当前的软件实现是指定一个Map(映射)函数,用来把一组键值对映射成一组新的键值对,指定并发的Reduce(归约)函数,用来保证所有映射的键值对中的每一个共享相同的键组。

云计算技术

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

监督学习技术

监督式学习(Supervised learning),是机器学习中的一个方法,可以由标记好的训练集中学到或建立一个模式(函数 / learning model),并依此模式推测新的实例。训练集是由一系列的训练范例组成,每个训练范例则由输入对象(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)。

聊天机器人技术

聊天机器人是经由对话或文字进行交谈的计算机程序。能够模拟人类对话,通过图灵测试。 聊天机器人可用于实用的目的,如客户服务或资讯获取。有些聊天机器人会搭载自然语言处理系统,但大多简单的系统只会撷取输入的关键字,再从数据库中找寻最合适的应答句。

无人机技术

无人机(Uncrewed vehicle、Unmanned vehicle、Drone)或称无人载具是一种无搭载人员的载具。通常使用遥控、导引或自动驾驶来控制。可在科学研究、军事、休闲娱乐用途上使用。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

生成模型技术

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。 它给观测值和标注数据序列指定一个联合概率分布。 在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。

生成对抗网络技术

生成对抗网络是一种无监督学习方法,是一种通过用对抗网络来训练生成模型的架构。它由两个网络组成:用来拟合数据分布的生成网络G,和用来判断输入是否“真实”的判别网络D。在训练过程中,生成网络-G通过接受一个随机的噪声来尽量模仿训练集中的真实图片去“欺骗”D,而D则尽可能的分辨真实数据和生成网络的输出,从而形成两个网络的博弈过程。理想的情况下,博弈的结果会得到一个可以“以假乱真”的生成模型。

主动学习技术

主动学习是半监督机器学习的一个特例,其中学习算法能够交互式地查询用户(或其他信息源)以在新的数据点处获得期望的输出。 在统计学文献中,有时也称为最佳实验设计。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

推荐文章
暂无评论
暂无评论~