算法走进餐馆,把关食品安全问题

芝加哥公众卫生部门的三十六个检查员监视着16000个食品机构,预防导致不良结果的食品安全问题。这些机构中有些会带来更高的风险,大约15%的检查能抓到一起严重的食品违规问题。

芝加哥像美国的大部分都市一样,通过食品机构的完整列表来制定检查计划,并确保在规定时间内将其都巡查一遍。该过程确保了每个机构都被检查到,但并不能保证最有可能的违规者会被率先检查,而且还涉及速度问题。每天不合格的厂商所提供的食品都有可能成为用餐者生病的诱因,还让其为此支付不必要的时间与医疗费用。

这就是为什么2014年芝加哥创新与科技部开始筛选公众城市数据,基于前期记录的违规特征建立了算法,来预测哪些餐馆最可能违反卫生条例。检查人员会首先查看程序给出的机构排名列表。这个项目不仅因为有效(算法能比传统方法提前预测出违规机构)而著名,还因为该团队让此方法能很容易地在其他城市进行复制。

然而,在芝加哥发布了算法代码一年多后,只有华盛顿政府尝试过去做同样的事情。所有的城市面临着食品安全的挑战,因此这样的数据程序将起很大作用。挑战不仅仅是设计有效的解决方案,还在于要以城市可共享的方式进行。芝加哥在推动共享和传播方面做出了表率。

在初始测试失败后,芝加哥创新团队重新改良了9个用来预测食品安全违规的变量,包括了前期违规、近期卫生投诉、距上一次观察的时间长度,以及如何进行权重分配。2014年的9月与10月,他们发布了一个优先检查清单,并与检查人员真正发现的违规情况进行了比对。结果表明,算法早在7.5天前就能发现违规,平均来说,比检查人员通常所用时间更快。

芝加哥的首席数据官Tom Schenk说:「测试给了我们足够的自信,让我们能将其推广到日常决策当中。」

公共卫生部门创新项目主管Raed Mansour提到芝加哥在2015年2月开始利用预测工具进行每日的运作,这之中的过度非常顺利。这是因为部门谨慎地将算法以最小改变现存商业实践的方式进行融合。例如,检查人员仍然从管理者处获得任务,但现在管理者从算法中获得日程安排。一年后部门将进行项目评估,Mansour期望其表现能达到或超过试运行的标准。

然而这仅仅是开始。回到2014年的11月,Schenk在GitHub上发布了算法代码,每个城市每个人都可以看到芝加哥所作的事,并且根据自己社区的情况进行修改。这一点可以让其将这套算法在美国各大城市进行推广,但是几个月后,事实证明,要推出市政数据程序需要的不仅仅是代码。

一个好想法并不意味着它就可以传播。《纽约客》的Atul Gawande用解决手术中两大灾难——疼痛和感染的例子来阐述这其中的困难。1846年首次麻醉术实行后,这项技术几个月后风靡了全世界,让手术变得不那么血腥。但诸如洗手与给手术室消毒的灭菌法则在数十年后才传播开来。尽管有证据说明它能拯救生命,但人们的行为却不会因此而改变。

Gawande说:「人们之间的交流仍然是改变世界标准的方式。」

数字化交流意味着现在的交谈并不需要面对面。城市数据创新家可以远程共享其概念与计划,只要他们知道着眼点和目标人群即可。但概念层面与活跃城市数据服务之间仍存在诸多阻碍。

对于初始者,Schenk提到会有一些知识产权上的问题。如果代码属于某一个人,其他城市就不能采用。开源数据方法解决了这个问题:城市可以选择共享其工作给那些感兴趣的人。但是如果程序员为项目支付高额成本或需要用某个专有软件,那么其他城市政府就无法使用。这就是为什么芝加哥选择用R这个开源数据项目的原因。

这还要求城市能有具有使用该软件的技术能力的员工。但Schenk认为这并不是什么难事,因为政府想要找到有这样能力并希望帮忙的热心学术机构或社区团体并不是难事。但这不意味着所有的问题都解决了。

「不同的城市会有不同的差别,即使是选择代码以适应特殊商业应用仍然需要大量工作。」Schenk说。另一个城市的公共卫生部门收集数据的方式和格式都不同,因此算法需要进行修改。也许每一个城市的健康风险最显著的变量也不尽相同。因此至少市政府在花费纳税人的钱,以数据驱动的方法来检查餐厅之前,需要测试一下该方法是否奏效。

芝加哥首先通过了免费样本测试,但一年后仅仅有一个政府尝到了甜头:华盛顿西北方马里兰州的蒙哥马利。这个城镇雇佣了一个私人公司Open Data Nation来修改芝加哥的代码。公司的董事Carey Anne Nadeau在2015年的秋季进行了一个为期两个月的测试,第一个月比起过去的商业模式多识别出27%的违规现象,而且时间提前了三天。

「最大胜利在于其可复制性——这是第一次人们能通过修改初始代码以进行应用。」她告诉CityLab,「这说明在芝加哥之外,它是可行的。」

蒙哥马利的首席创新官Dan Hoffman说道,它不仅仅在芝加哥之外可行,也可以广泛用于不同的环境中。蒙哥马利有500平方英里,包括了城市、乡村与郊区。它的成功验证了这个方法的强大。

为了达到这一目的,Nadeau的团队增加了一些变量,比如Yelp评论、附近建筑的允许(建筑可能扬灰并滋生细菌,导致食品的不卫生)。目前,改进算法仅仅在理论中成功,因此亟需实际测试去验证这些结果是否能用于日常操作中。Open Data Nation的下一步就是生产一个健康监察移动应用,并为其他十个城市建立相似的算法。

为了推动项目进行,Open Data Nation提出了一种弥补城市间数据鸿沟的方法:私人企业合伙人。如果一个城市没有专业资源去建立预测算法代码,他们可以委托给公司来做。公司收取收益,如果有效,则政府通过效益节省了这笔开支。Nadeau强调道:「即使蒙哥马利的餐厅愈来愈多,也并不需要增加食品检验预算来适应城市的增长。」

为了充分利用城市数据进行预测,城市可以与数据公司和研究人员进行合作,还可与慈善基金进行合作以弥补资金短缺。Knight Foundation基金会已经对居民数据实验开展了Prototype Fund项目进行支持,Bloomberg也推出了What Works Cities项目。

芝加哥大学数据科学与公众政策中心的博士后研究员Eric Potash指出,城市政府拥有数据专家会有更多益处。他正在与芝加哥公共健康部门进行合作,利用数据在孩童铅中毒之前预测房屋内的铅污染。他指出收集数据是一个繁冗的工作,不同部门储存着不同的信息。如果「在内部」就有支持者,则可以大大加速这个过程。

最终,请记住预测模型仅仅是一个优化工具,这很重要。它的好与坏仅仅取决于它是否能帮助政府更有效地工作。

「发现孩子可能会铅中毒听起来很棒,」Potash说,「但在很多情况下,政府利用预测科技而人们却完全不感兴趣,预警就是个反面教材。并不是『预测就可以解决所有问题』。」

入门算法
暂无评论
暂无评论~