听说读写看,机器学习改变世界的五种方式

现在谁还记得读书时计算机编程课的经历?无论是无限打卡洞,还是写一些DOS或其他语言指令,你都会清楚一个事实:计算机需要一组极为精确的指令集才能完成一项任务。 任务越复杂,指令自然越复杂。 机器学习与自然指令有着本质区别。程序员不是告诉机器如何解决问题(用他自己的方式),而是告诉机器如何自行学习解决问题。 机器学习本质上就是为了识别数据中隐藏的信息模块和从模块中作出预测,它是一个从统计学延伸出来、极为前沿的领域。 1950年,人们开始研究机器学习,那时候计算机科学家们已经知道如何指导计算机下棋。随着计算能力飞速提升,计算机可以识别越来越复杂的模式和图案,做出的预测以及解决的问题也越来越多。

1、机器可视

由于计算机可以搜索大数据集,用机器学习算法对图像进行分类,因此,编写识别图像性质和图像分类的算法,就相对比较容易。 举个例子,一般情况下,乳腺癌扫描结果需要四位有经验的病理学家审阅,根据看到的结果做出诊断评估。但是现在,有了检测癌症的算法,其准确率比最好的病理学家的准确率还要高,医生们可以腾出时间更快地准确做出治疗决定。 [caption id="attachment_5908" align="aligncenter" width="640"]国际工人智能联合会议上的AI装置 国际工人智能联合会议上的AI装置。JUAN MABROMATA/AFP/Getty Images[/caption] 计算机视觉能力是无人驾驶汽车的基石。计算机可以区分树与行人、停车和让路标志,或者路和田野——这是无人驾驶汽车的未来保证。仅该项创新就能颠覆许多商业模式——从供应链、交付到个人出行。

2、机器可以阅读

谷歌在很久以前证明了可阅读程序的价值。他们的搜索引擎算法改革了互联网搜索,这一变革仍在进行着。 但是,能够识别文件中是否有一个关键字或短语是一件事,完全理解所有内容是另一件事。 谷歌研发的新算法可以判断一个句子是主动还是被动、文件中的上下语境等等。 实际上,利用谷歌街景以及读取街号的能力,谷歌在几个小时内就可以绘制法国的所有地址——而同样的工作,要花费许多有天赋的地图制作者数周时间,在过去甚至是数月。

3、机器可以聆听

近几年最大的创新也许就在你的口袋里。Siri、Cortana,还有Google Now代表了机器聆听人类语言的一大进步。 有多少次你曾因为电话帮助热线另一端的电脑无法理解你的需求,而备感沮丧?(对不起,我没有听懂,请再说一遍……) 现在,虚拟私人助理可以识别无数以及更多的命令并相应作出反应。然而更加重要的是,谷歌与其竞争者正在进化他们的搜索算法,以便理解更加自然的语言,并希冀未来更多使用语音搜索。 在过去,你也许会输入一些类似咖啡店+伦敦+邮编来寻找一个地区的咖啡馆。今天,你可以输入——或者说一句话,比如「最近的正在营业的咖啡馆在哪里?」,谷歌不仅能够理解你的意思,你在哪里,什么时间,还知道如何回答。

4、机器可以交流

是的,Siri可以跟你讲一个类似knock knock的冷笑话,但那不是我们所谓的交流。 计算机语言翻译很多时候被看成是笑话,是有原因的。语言因为俚语,俗语,文化上意义的不同,会有很多细微差别。简单地放一段话到翻译软件里翻译经常会闹笑话,会词不达意。 去年年底,微软公布了Skype电话会议英语西语之间的实时翻译功能,还计划支持40多种语言。 翻译水平的进步让人印象深刻,它集听、理解和实时翻译于一役,是一次重大突破。由于这个项目使用了机器学习,因此,不断的使用只会让它越来越好。

5、机器可以写作

莎翁的巨作可能需要一百万只猴子来打字输入,但是,电脑已经变得越来越擅长创作型写作了。 有一个项目,电脑曾被教导如何为照片添加旁白。在第一次试验中,4次中有1次读者都认为电脑生成的图文描述比人为添加的更好。 这对以前需要人工参与的数据录入和简单分类,产生了巨大的影响。如果电脑可以简单辨别图片、文件还有文件夹,并对之进行准确描述,其应用范围将会很广。 另外一个提到过的例子,2015年的温博尔顿网球冠军赛釆用了以机器学习为基础的算法,自动将每场比赛统计、传感器数据生成新闻,读起就象是出自体育记者之手。 这些技能告诉人们,计算机可以挺进那些曾被认为只有人类才能做到的领域。这项技术还尚不完美,但是机器学习的能力一定会越来越好。 来自forbes,作者Bernard Marr,机器之心编译出品。参与人员:Xuechen,Chen Xiaoqing,周瑾,微胖。
入门
返回顶部