AI也能种黄瓜了,你想尝尝吗?

编者按:在由荷兰瓦格宁根大学与研究中心主办的自动化温室挑战赛中,来自微软研究院的Sonoma团队取得了第一名的成绩。他们开发的AI代理利用基于模型的近似贝叶斯强化学习并借助相关领域专家的专业知识,在净利润值指标上,超越了作为对标参考的人类种植专家。本文编译自微软研究院博客文章Competition win a steppingstone in the greater journey to create sustainable farming。

为了应对不断增长的世界人口对传统粮食生产方法所带来的挑战,荷兰瓦格宁根大学与研究中心(Wageningen University & Research)和企业赞助商腾讯公司在2018年共同举办了一项利用人工智能技术种植黄瓜的国际“自动化温室挑战赛”,希望可以打造一个无需现场专业人员看管即可自行运转的“未来温室”。主办方要求参赛者利用人工智能对黄瓜种植进行远程操作,在最大限度提高黄瓜产量的同时,把资源消耗降到最低。

来自瓦格宁根大学与研究中心、腾讯英特尔、Delphy & AgroEnergy、微软等公司的多个团队参加了此次比赛。赛事主办方在位于荷兰布莱斯韦克(Bleiswijk)市的荷兰瓦格宁根大学与研究中心校园内为每个团队分配了96平方米的温室空间,每个温室都配备着完全相同的系统,包括通风、加热和人工照明,以及用于测量温度、湿度和能量消耗的传感器等装备。各参赛队伍只被允许进入其指定的温室一次,安装各自需要的额外传感器和监测设备,其它时间里,他们只能远程运行各自的AI系统。

比赛的评分标准包含三个部分:净利润额、算法性能、以及资源使用效率。其中,净利润额所占的权重最大(50%);算法新颖性和性能占30%;而根据能源、水、二氧化碳和农药使用计算得出的效率指标则占20%。

最终,由微软研究院首席研究工程师Kenneth Tran带领的Sonoma团队所开发的系统以净利润值超出第二名25%的成绩赢得了比赛,并在综合可持续性方面也被赛事评审评选为最优方案。他们创下的记录是每平方米温室的黄瓜产量超过55千克、净利润25欧元。在净利润值的指标上,Sonoma团队甚至超越了作为对标参考的人类专家种植者,净利润高出了17%。这是全球范围内首次实现远程AI控制下的温室黄瓜栽培。

Sonoma团队成员——Thomas Follender Grossfeld, Kenneth Tran, Chetan Bansal, and David Katzin(从左至右)

对于Sonoma团队来说,跟远程采集数据相比,数据采集的方法其实更具挑战性。团队需要设计一整套系统来应对墨菲定律——“任何可能出错的地方一定会出错”。所有的数据是从传感器盒、摄像头、温室所用的API等多个来源采集到的,这些数据源都有可能出现故障,而在实际比赛过程中也确实发生了故障。所以,比赛的关键就在于你是否能够及时检测到故障,并且快速做出反应。其实,这些故障也是实际生产环境中会碰到的问题。所以,他们必须要能够设计出一个可以有效解决这些问题的系统。

Sonoma的AI方法论

在AI系统框架的搭建上,Sonoma团队选择基于模型的近似贝叶斯强化学习(RL),因为这一方法具有较高的样本效率,并且便于推广。Tran表示:“样本效率对现实世界的应用至关重要。即使在简单环境下,标准的强化学习算法仍需要数以百万计的试验,才可以培训出良好的代理。对于游戏领域而言,这并不是一个问题,一个代理能够随心所欲地玩各种游戏,所以RL在游戏中已经表现得很成功。而在实际应用中(例如黄瓜种植),我们无法承受数百万次的失败尝试,所以我们需要以不同的方式来思考RL。”

为了让强化学习成为能够应对当今粮食问题的可行解决方案,Sonoma团队认为AI代理必须在初始阶段就要像任何现有系统一样强大,并能够随着时间推移不断学习和改进。团队构思了一个能够综合这些特点的框架(见下图)。

这个框架以训练概率动态模型为起点。这种模型学习类似于模拟器构建,它可以帮助AI代理通过“想象”进行规划。此外,通过模仿学习,AI代理在初始阶段就能像现有的专家级策略那样行事。之后,AI代理将在基于模型的策略持续优化过程上运转,通过每次环境交互来提高其整体性能。

在温室挑战赛中,天气条件等来自温室外围的数据,以及来自传感器和温室内部的图像数据都被输入到代理中,接着由后者确定人工照明的强度和分布,给予植物的水分、二氧化碳和养分的量,以及温室温度。所有这些设置的依据都来自于框架对于如何产生最多生物量(biomass)的学习结果。

Sonoma团队成功地将当前关于作物种植和管理以及温室环境控制的最佳知识和实践方法纳入其温室人工智能控制系统中,团队从先前模型数据中确定了从高植株密度系统入手,并根据作物生长期间的作物表现和气象条件调整AI气候控制,以实现这种高密度/高产量系统的最佳性能。

由于比赛规则仅允许一次尝试,而且在赛前相关数据并不多,因此,Sonoma团队采取了保守的、依靠领域专家手工制定的策略。通过与领域专家合作,利用他们的知识以及AI代理的能力,Sonoma团队才能够在短时间内产生较好的结果。

Sonoma团队温室黄瓜自动化种植过程

AI for Earth

对于微软而言,在自动化温室挑战赛中展示的工作只是“人工智能地球计划(AI for Earth)”的一部分,这一计划于2017年7月启动,旨在借助云计算物联网和AI技术,保护和维持地球及其自然资源,通过资助、培训和深入合作的方式,向水资源、农业、生物多样性和气候变化等领域的个人和组织机构提供支持。该计划涉及的领域和资金支持一直不断扩大,并且已经在数据驱动型农业领域取得了令人印象深刻的进展。


FarmBeats也是这一计划的项目之一,是在户外环境下通过传感器、无人机以及其它设备改进数据采集,提高农业的可持续性;而Sonoma团队的工作则专注于受控环境农业(CEA),这是一种封闭的种植系统,允许种植者配置并实现光照、温度、湿度和二氧化碳浓度等环境因素的最优组合。作为满足地球人口营养需求的更高效、更便利手段之一,CEA将对农业生产带来重大影响。


从2017年开始,Tran对CEA领域就产生了浓厚的研究兴趣,他和同事们一直在探索机器学习技术在现实世界中的应用潜力。而CEA则是强化学习模型的理想训练场所。CEA提供了多种可以利用的受控场景和丰富的数据,由于运用了传感器和物联网等技术手段,数据采集更加便捷。因此,Tran及其同事发起了Sonoma项目(同时也是温室挑战赛团队的名称),他们的应用重点是温室和垂直农业,两者在更安全、更快速地进行粮食生产方面都有着巨大潜力,并且对传统农业的两大基础资源——水分和土壤的消耗更少。根据温室挑战赛官方网站的资料,与传统的农业手段相比,获得相同的收成,温室和垂直农业等室内种植手段仅需消耗十分之一的水资源和土地面积,而且消耗的农药和化肥也较少。

这种极具前景的农业解决方案需要庞大的室内农业专家队伍,但专家队伍的数量远远落后于室内农业发展的需求。因此,Sonoma项目的目标就是利用人工智能帮助农业生产实现自动化管理,这样可以帮助将发达国家(如荷兰)的专业农业知识扩展到发展中国家,同时也可以进一步提升高专家种植者的能力。

为了达到Sonoma项目的目标,Tran采取了“自下而上、自上而下”两种项目实施方法。“自下而上”是指开展底层强化学习的创新研究以及以应用为中心的研究,强化学习的应用型研究尚处于早期阶段,新的研究还有非常大的应用潜力;而“自上而下”则是指寻求与世界各地的领域专家们展开合作,Sonoma项目的成员包括来自微软研究院的AI领域专家,来自加拿大农业和农业食品部(AAFC)的植物学家Xiuming Hao,来自美国俄亥俄州立大学受控环境农业教授Chieri Kubota,以及其他合作者。

从左至右:植物学家Xiuming Hao,温室蔬菜专家Shalin Khosla,微软研究院首席研究工程师Kenneth Tran

微软研究院AI头条
微软研究院AI头条

专注科研19年,盛产黑科技

产业智慧农业机器学习模仿学习强化学习微软
1
相关数据
英特尔机构

英特尔是计算创新领域的全球领先厂商,致力于拓展科技疆界,让最精彩体验成为可能。英特尔创始于1968年,已拥有近半个世纪产品创新和引领市场的经验。英特尔1971年推出了世界上第一个微处理器,后来又促进了计算机和互联网的革命,改变了整个世界的进程。如今,英特尔正转型成为一家数据公司,制定了清晰的数据战略,凭借云和数据中心、物联网、存储、FPGA以及5G构成的增长良性循环,提供独到价值,驱动日益发展的智能互联世界。英特尔专注于技术创新,同时也积极支持中国的自主创新,与产业伙伴携手推动智能互联的发展。基于明确的数据战略和智能互联全栈实力,英特尔瞄准人工智能、无人驾驶、5G、精准医疗、体育等关键领域,与中国深度合作。面向未来,英特尔致力于做中国高价值合作伙伴,在新科技、新经济、新消费三个方面,着力驱动产业协同创新,为实体经济增值,促进消费升级。

https://www.intel.com/content/www/us/en/company-overview/company-overview.html
相关技术
微软机构

微软是美国一家跨国计算机科技公司,以研发、制造、授权和提供广泛的计算机软件服务为主。总部位于美国华盛顿州的雷德蒙德,最为著名和畅销的产品为Microsoft Windows操作系统和Microsoft Office办公室软件,以及Xbox的游戏业务。微软是美国《财富》杂志2015年评选的世界500强企业排行榜中的第95名。

https://www.microsoft.com/en-us/about
权重技术

线性模型中特征的系数,或深度网络中的边。训练线性模型的目标是确定每个特征的理想权重。如果权重为 0,则相应的特征对模型来说没有任何贡献。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

云计算技术

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

无人机技术

无人机(Uncrewed vehicle、Unmanned vehicle、Drone)或称无人载具是一种无搭载人员的载具。通常使用遥控、导引或自动驾驶来控制。可在科学研究、军事、休闲娱乐用途上使用。

模仿学习技术

模仿学习(Imitation Learning)背后的原理是是通过隐含地给学习器关于这个世界的先验信息,就能执行、学习人类行为。在模仿学习任务中,智能体(agent)为了学习到策略从而尽可能像人类专家那样执行一种行为,它会寻找一种最佳的方式来使用由该专家示范的训练集(输入-输出对)。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

腾讯机构

腾讯科技股份有限公司(港交所:700)是中国规模最大的互联网公司,1998年11月由马化腾、张志东、陈一丹、许晨晔、曾李青5位创始人共同创立,总部位于深圳南山区腾讯大厦。腾讯由即时通讯软件起家,业务拓展至社交、娱乐、金融、资讯、工具和平台等不同领域。目前,腾讯拥有中国国内使用人数最多的社交软件腾讯QQ和微信,以及中国国内最大的网络游戏社区腾讯游戏。在电子书领域 ,旗下有阅文集团,运营有QQ读书和微信读书。

http://www.tencent.com/
推荐文章
暂无评论
暂无评论~