王一丁、张秋玥、罗然、钱天培编译

全民AI时代:干洗店老板、高中生齐上阵

1975年冬天,旧金山半岛的广告牌上出现了一则有点“奇怪”的消息。

“你是否在尝试自己做电脑开发呢?,如果是的话,参加我们的聚会!”

这则通告来自当年的Homebrew计算机俱乐部。Homebrew是一个业余爱好者社区,俱乐部成员对一种当时叫做微处理器的新型组件的潜力很感兴趣。

Homebrew的第一次会议是在加利福尼亚州的Menlo Park的一个车库召开的,有32人参加,其中一位名叫Steve Wozniak的年轻工程师。他后来还将他的朋友Steve Jobs介绍进俱乐部。

参加了此次会议的退休企业家Len Shustek说:“这个俱乐部证明了,并不是所有技术进步都必须发生在大公司和大学。”

对于人工智能而言,同样的事情也正在发生。

得益于人工神经网络及相关技术,自2012年,计算机在理解语音和图像方面的能力已经越来越强。

真正掌握这种人工智能技术需要对计算机有深入理解,拥有多年的研究经验以及扎实的数学功底。如果这些条件你都具备,那么恭喜:像亚马逊,Facebook,谷歌或其他少数积极拥抱人工智能策略的巨头已经开始争相抢夺你了。

然而,在这场“AI优先”的竞争中,也不乏一些任何人都可以学一学,用一用的工具和备件。为了吸引顶级科学家和应用程序开发人员,科技巨头已经将一些内部AI构建工具包以及他们的一些研究免费发布。

在这场硅谷AI梦实现的进程中,专业或非专业的爱好者正在使用几乎相同的技术。

负责谷歌和百度相关项目的吴恩达说“现在,高中生都可以做到几年前最优秀的人工智能从业人员所做不到的事”。

吴恩达为代表,不少人认为人工智能在非传统计算机领域有突破是很有希望的:他们希望它不仅仅限于硅谷,而应广泛地在物理和文化上传播技术的潜力,看看当技术门外汉根据他们自己的喜好和观察方式“训练”神经网络时会发生什么。

吴恩达设想会有这样的场景:有一天,印度的一个人可能会通过在人工智能的在线视频中学到的东西来使当地的饮用水更加安全。

当然,也有一些DIY的神经网络是“少儿不宜”的。去年年底,一个Reddit帐户发布了一内容似乎是神奇女侠扮演者Gal Gadot的色情视频,这个视频在Reddit上流转,后来又到了成人视频网站。但是细心的观众可以注意到,视频中的Gadot的脸上偶尔会出现一个像松散的面具似的区域。

发布者解释说,这个剪辑是通过训练神经网络来生成的:一个与视频原始人物的表情相匹配的Gadot图像。之后他们在网上发布了代码和方法,这样任何人都可以制作类似他们自己的“deepfake”剪辑。

总而言之,人工智能DIY时代带给我们的,可能并非都是正面的,当然也不会都是负面的。大多数情况下,它会在特定领域表现的十分优秀。

下面让我们看看那些通过计算机新技能的先驱者以及他们取得的成就:

自学成才的码农Robbie Barrat利用人工智能在艺术创造中融入嘻哈与时尚的设计因素。

我训练了一个会写歌词的神经网络

当ROBBIE BARRAT还在西弗吉尼亚州的农村中学时,他就开始从当地一家回收中心收购旧电脑,将它们拆开再重新组合在一起,然后开始自己在家里的农场上学习编程。

在与朋友讨论计算机是否具有创造性之后,他在高中时选修了AI及相关课程。为了证明计算机也有创造性,Barrat在Kanye West的歌词上训练说唱的神经网络。Barrat的小伙伴都非常喜欢这个AI系统,但这一成果却让一些成年人感到震惊。“老师有点不高兴,因为他们说这个神经网络‘有点粗俗”。

这个有些玄乎的人工智能系统帮助Barrat走出了农场。他的成绩不够好,无法进入理想的学校学习数学或计算机科学。但该项目帮助他得到了一个在硅谷中心的自驾车项目的实习。自此,他搬到了斯坦福大学,如今他正在斯坦福的生物医学实验室工作,试图开发能够识别具有药用潜力分子的神经网络。但是,培养神经网络来制作艺术仍然是他的热情所在。

如今,在业余时间,Barrat使用时装秀的视频剪辑和照片,来制作人工智能生成的穿着新服装的模特图像。结果不尽人意——有没有想过你会喜欢缠在小腿上的裤子,或者是从一侧悬挂着巨大小袋的毛衣?不过,Barrat正在与设计师合作,让它们成为真正的衣服。他迫不及待想要尝试。

佐治亚大学的计算机科学专业的新生Shaza Mehdi训练了一个神经网络来识别植物疾病

诊断植物性疾病?下载一个程序就行啦

Shaza Mehdi家前院种了一种名为ROSEBUSHES的花。这种花很漂亮,但容易生病。去年的某一天,Mehdi突然问自己:为什么她不能用手机来给这种花诊断疾病呢?然后,她遇到了神经网络

Mehdi不会编程,她身边的成年人可以给予她鼓励,但在专业知识方面却无法给予帮助;她的学校没有提供计算机科学的入门课程。于是,Mehdi通过YouTube视频和在线教程自学了编程语言Python和神经网络的基础知识。如今当她当回忆学习期间的事时,她还会兴奋得提起她debug的经历。

Mehdi尤其受到一个斯坦福大学研究人员的YouTube视频启发。该研究人员建立了一个神经网络,其识别皮肤癌的水平与经过医学会认证的皮肤科医生相当。

她找到了一套复现神经网络的在线教程。第一步是下载经过培训可以识别厕所和茶壶等日常用品的软件。第二步是通过输入大约10,000张标记的病态植物图像来重新调整其视觉参数。这些图像是由Mehdi在网上孜孜不倦地收集来的,根据不同疾病分门别类。

在2017年末,她终于将这个她命名为plantMD的应用程序用于测试。Mehdi紧张地看着一株病怏怏的葡萄树,其叶子上有浅绿色与褐色斑点。一片有凹坑的叶子在手机屏幕上突然聚焦。心脏还没来得及跳几下时,“葡萄炭疽病”这个短语就在屏幕上出现了。网络搜索证实了该诊断:这是一例真菌感染的明显病例,也称为鸟眼腐烂。

田原大佑在网上学习了机器学习的相关知识,并用它来自动完成自家干洗生意的部分工作

随时可以检查衣服的相机

在日本老龄化严重的小城市,干洗是一项艰巨的任务。田原大佑的家族在田川拥有8个干洗店——这是一个拥有约5万人的南部地级城镇,在那里找到优秀的员工很难。所以田原开始考虑让计算机增加他的劳动力。

一开始,38岁的田原试图通过更好的计算机系统实现业务现代化,以记录和跟踪订单。但他的大多数员工都没有什么技术经验,很难适应。

“他们记性很不好,”田原说。因此,这位自学成才的程序员开始研究软件如何通过仅仅观察客户的衣物来进行自动检查。他在网上阅读有关机器学习的知识,尽量提升他的英语和编程能力。在店里,他拍摄了4万张西装,衬衫,裙子和其他服装的照片,并用它们来训练他的代码。

7月,田原开始在他的一家商店测试他的系统。顾客将衣服放在桌子上,头顶安装摄像头。他的软件在观察衣服后给出预测(比如,两件衬衫,一件夹克),然后让客户在平板电脑上进行确认。刚开始,员工必须在第一时间帮助客户适应这种方式。之后,客户们可以单独使用它。

田原说,他的工人起初对他的创新持怀疑态度,但这态度在发现这项创新使他们的工作变得更容易之后就被转变了。他不打算以此项目为借口来开除人类雇员,但他希望这会有助于他扩张店面。“我想开一家只有机器,没有员工的商店,”他说。

Will Roscoe在加利福尼亚州的Oakland跟着他的自动驾驶汽车。他想通过这一各类零件组装起来的小车来证明自动公共交通概念的可行性

微型自动驾驶汽车

在加州Oakland一个仓库里,一小群书呆子围在一起看着Will Roscoe用拇指轻拍手机。

在他的脚下,一辆塑料皮被撕掉的遥控车开始在划伤的水泥地板上环绕着黄白色胶带标记的赛道行驶–Roscoe完全没有输入进一步指令。这辆近乎弗兰克斯坦式的小车有一个摄像头以及一堆电子元件,被用拉链绑在其顶部。它的大名叫做驴车。

Roscoe不是人工智能专家,但他这项创作使用了类似于谷歌无人车Waymo所依赖软件的神经网络软件来帮助小车感知环境。

作为一名受过培训的土木工程师,Roscoe受到政治失意的启发创造了驴车。2016年,他参与竞选湾区地铁系统BART的董事会。Roscoe承诺通过用自动驾驶电动公交车取代火车来增加载客量,但他最终仅获得了第三名。建立自己的小型自动驾驶汽车似乎是向选民展示这项技术不是纯粹幻想的好方法。“我想证明它可以在小范围内发挥作用,”他说。

事实证明,他的时机非常完美,一个专门遥控车的机器人爱好者团体hacking RC cars在不久之后于附近的伯克利举行首次会议。在那里,他遇到了Adam Conway——Adam提出可以帮忙建造小车。

Roscoe是一位自学成才的程序员,他使用TensorFlow建立了自动驾驶仪。他还借用了RC汽车聚会参与者的一些神经网络代码。Roscoe的最终成品通过在示范运行期间观察人类操纵车辆来学习驾驶。

他将他的创作命名为驴车(Donkey Car),因为他认为这辆车在某种程度上和驴非常像:对孩子们来说非常安全,从传统审美看并不优雅,还常常不服从指令。

Roscoe和Conway将他们所有的软件和硬件设计放在网上供其他人使用。驴车(Donkey Cars)现在在香港,巴黎和澳大利亚墨尔本都有比赛举行。

今年1月,在Oakland的某个仓库中,9辆自制的自动驾驶汽车试图在赛道上一争高下;竞争车辆之一是由三个高中生建造的驴车。

这些车辆也开始在赛道之外发挥作用。洛杉矶附近的两个业余爱好者对它们进行了一些修改,以便在沙滩上发现并挖掘垃圾。

在Oakland,Roscoe的驴车悬架上卡了许多树叶。“常常把它带到人行道上。”

“看,我连狗链都准备好了呢。”Roscoe说。

相关报道:https://www.wired.com/story/diy-tinkerers-artificial-intelligence-smart-tech/

大数据文摘
大数据文摘

秉承“普及数据思维,传播数据文化,助⼒产业发展”的企业⽂化,我们专注于数据领域的资讯、案例、技术,形成了“媒体+教育+⼈才服务”的良性⽣态,致⼒于打造精准数据科学社区。

产业机器人神经网络人工智能应用
相关数据
亚马逊机构

亚马逊(英语:Amazon.com Inc.,NASDAQ:AMZN)是一家总部位于美国西雅图的跨国电子商务企业,业务起始于线上书店,不久之后商品走向多元化。目前是全球最大的互联网线上零售商之一,也是美国《财富》杂志2016年评选的全球最大500家公司的排行榜中的第44名。

https://www.amazon.com/
相关技术
吴恩达人物

斯坦福大学教授,人工智能著名学者,机器学习教育者。2011年,吴恩达在谷歌创建了谷歌大脑项目,以通过分布式集群计算机开发超大规模的人工神经网络。2014年5月16日,吴恩达加入百度,负责“百度大脑”计划,并担任百度公司首席科学家。2017年3月20日,吴恩达宣布从百度辞职。2017年12月,吴恩达宣布成立人工智能公司Landing.ai,并担任公司的首席执行官。2018年1月,吴恩达成立了投资机构AI Fund。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

自动驾驶汽车技术

自动驾驶汽车,又称为无人驾驶汽车、电脑驾驶汽车或轮式移动机器人,是自动化载具的一种,具有传统汽车的运输能力。作为自动化载具,自动驾驶汽车不需要人为操作即能感测其环境及导航。

TensorFlow技术

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

张量技术

张量是一个可用来表示在一些矢量、标量和其他张量之间的线性关系的多线性函数,这些线性关系的基本例子有内积、外积、线性映射以及笛卡儿积。其坐标在 维空间内,有 个分量的一种量,其中每个分量都是坐标的函数,而在坐标变换时,这些分量也依照某些规则作线性变换。称为该张量的秩或阶(与矩阵的秩和阶均无关系)。 在数学里,张量是一种几何实体,或者说广义上的“数量”。张量概念包括标量、矢量和线性算子。张量可以用坐标系统来表达,记作标量的数组,但它是定义为“不依赖于参照系的选择的”。张量在物理和工程学中很重要。例如在扩散张量成像中,表达器官对于水的在各个方向的微分透性的张量可以用来产生大脑的扫描图。工程上最重要的例子可能就是应力张量和应变张量了,它们都是二阶张量,对于一般线性材料他们之间的关系由一个四阶弹性张量来决定。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

暂无评论
暂无评论~