Butler Lampson作者

Butler Lampson:计算机技术需要什么样的公共政策?

编者按:在微软亚洲研究院主办的第二十届“二十一世纪的计算”大会暨微软教育峰会上,1992 年图灵奖得主、微软新英格兰研究院技术院士Butler Lampson与我们分享了在计算机科学技术飞速发展并产生越来越大的社会影响力的今天,我们需要什么样的相关公共政策,来保证技术使用者的人身安全与信息安全。


Butler Lampson在“二十一世纪的计算”大会暨微软教育峰会上的演讲视频

随着计算机在社会中的广泛应用,我认为我们需要更多地思考计算机科学技术如何与社会规范和社会进程同步发展。虽然对社会规范来说,不同地区会根据不同的社会现象与文化背景做出不同的选择,但我们能做的是,用技术为合理的社会规范提供一些通用的解决方案。在这次的演讲中,我将通过三个例子来进行解释:一是物联网设备的安全;二是在线个人数据的隐私保护;三是区块链的浪潮。

失控的物联网设备

物联网安全虽然目前还不是一个特别严重的问题,但随着物联网设备在人们的生活中越来越普及,在不久的将来,无论是因为设备本身的故障,还是因黑客攻击造成的设备失灵,这些问题都将可能威胁使用者的生命,比如失控的红绿灯、煤气炉、无人驾驶汽车等等。此外,如果设备制造商雇佣不到一流的程序员,无法造出符合安全标准的产品,也将导致更多事故发生。

我认为安全的物联网设备必须具有两个条件:安全的基础以及正确的架构。

安全基础包括安全升级、可靠的云连接、以及保证涉及安全的核心代码的独立性。我们必须通过安全升级修复漏洞,并通过连接稳定的云系统、可准确辨识的设备,让设备在出现问题时能被准确追踪。现存的CPU和操作系统过于复杂,我们需要有更好的硬件与软件以满足物联网安全的需求。目前新一代的物联网硬件已经开始涌现出来,微软在这方面贡献的一种解决方案:专为物联网应用打造的操作系统Azure Sphere及相应的硬件支持。

我们知道好的计算机系统追求简单,因此不仅要让涉及安全的核心代码成为独立的部分,还要尽量“小而美”。这就意味着规范、硬件、软件都要尽量简化,但我们都知道,这对庞大的物联网系统来说是极其困难的,因为其中可能包含机器学习计算机视觉语音识别等多方面的技术。那么如何让系统简单、可以理解的同时又保证安全呢?我的方案是通过一个简单的监控器来监控所有与安全有关的输出。这个监控器要同时满足四个条件:一是安全性;二是它是独立的一个模块;三是要专门负责安全任务的输出;四是依靠简单来保证安全,要经过充分测试和形式验证。当监控发现违反安全的行为被触发后,可以转为手动操作。

举一个例子,十字路口的红绿灯系统非常复杂,它可以通过计算机视觉检测车辆和行人,可以通过机器学习掌握以往的历史数据来预测未来车流,也可以和其它路口的红绿灯协同疏导和控制交通。想要让这样一个复杂系统没有bug是非常困难的。但是从安全角度来说,监视器只需要保证一个路口最多只有一个方向的绿灯是亮着的,并且红灯转为绿灯中间必须有一段不短于5秒的黄灯。这个条件非常简单直观,并且容易验证。虽然这样的条件不能保证红绿灯系统有最高的效率,但已经可以保证它的安全性了。当然,并不是所有的物联网设备都能找到这样简单的监控规则,比如我不知道应该怎样简单定义自动驾驶汽车的安全性。但无论如何,让系统足够简单是我唯一知道能保证可靠性的方法。

 当然,监视器是额外的设备,需要额外的研发,这对制造商来说昂贵而耗时。但我们依然应该综合上述标准去生产物联网设备,因为这是性命攸关的一项任务,一旦有威胁生命的事故发生,企业就要接受问责,政府也会着手管理。但政府的管理必须在加强监管的同时也要防止阻碍创新,所以政府应该设定一些简单而易于检验的规则,而不是一刀切阻止物联网设备的使用。所以我认为基于安全基础和独立的监控器架构生产物联网设备是切实可行的。

掌握自己的网络数据

人们都希望能将网络数据掌握在自己手中,不仅知道谁拥有你的个人数据,更可以限制他们对这些数据的使用,这就需要通过制定规则来妥善管理数据。然而,目前没有任何一种技术手段能够确保我们对个人数据的控制,因为世界上不同地区的文化与政策存在很大不同,也不可能有全球适用的数据管理统一规定。但尽管如此,技术上的统一性仍然可以满足差异化的地区规定。

互联网时代个人数据的两个特性给我们带来了不安。在互联网上,个人数据会在时间和空间两个维度上广泛传播,具有持续性,每一个人都能看到并轻松复制你的个人数据;此外,网络数据很容易通过搜索获得,因此每个人几乎没有隐私可言,想要真正匿名是非常困难的。除了虚拟世界中产生的数据外,与人们现实生活有关的个人数据安全也越来越重要,比如照片、视频、车牌号、个人定位等等。

也许你会幻想一个极其理想的场景:你把关于自己的所有数据储存在一个数字保险柜里,在别人向你发起请求时,你可以有选择地回复信息。不过这显然是天方夜谭,这样做不仅成本高、效率低,而且你依旧不知道别人拿到你的个人信息后会如何利用,对于整个社会而言,这一方式也将阻碍以学术研究和公共利益为目的的数据收集。

我认为可行的做法是以数据为中心的个人数据管理。没有中央数据库数据管理者会为个人数据做以下标记:数字ID,以及对用户的个人隐私政策的一个链接。这个标记会始终与用户的个人数据捆绑着一并存在,并始终随着用户个人数据的变化而变化。

这种方式依旧要求数据管理者和使用者严格遵循规则,只有在数据管理者接受监管的条件下才能很好地运作——数据管理者必须为每一条数据做标记,且在使用数据时都遵守链接中用户的个人隐私政策。这一方式有几个与政策有关的特点:首先,它以用户数据为中心,而不是以设备或服务为中心,不是基于某个设备来储存的,而且直接与个人数据的使用政策相连;其次是规则必须非常简单,降低广大用户的学习成本;最后是采用简单的标准政策实现更加广泛的数据调度

当然,这样做的前提是数据的使用者接受政府监管并且遵守用户对数据设定的权限,这一点必须由政府法制的力量来保证。只有这样,用户才能拥有掌控自己个人数据的能力。

区块链究竟带来了什么?

第三个我想讨论的话题是——区块链究竟有什么优势?

近十年来,区块链是继人工智能后掀起的第二股热潮。区块链被鼓吹有很多优势,但是事实上,并不是目前大肆炒作的这些优势都是真实存在的,比如数字货币,数字货币的价值事实上取决于它被人们交易或消费的价值,而政府必然会对数字货币进行严格的管控,所以区块链实现的数字货币是个伪命题,只会在非法交易中找到应用;再比如,不可更改的公共账本(immutable public ledger),有什么人会想把账本公开呢?“智能合约”以及社会信任等等,比特币交易虽然进行得如火如荼,但它终究不是百分之百值得信赖的。

我的思考是,区块链的真正价值正来自它对产业的冲击。其实许多涉及多方的繁琐流程早在很久以前就可以实现自动化,例如房地产销售、外资银行转账等。是社会的惰性使它们保持原样,而区块链带来了竞争,带来了改变的压力和动力。所以随着区块链的火热,越来越多人开始思考一些从未考虑过的问题,并做出改变。

我认为另一个值得我们思考是,把区块链作为一种工作流(workflow),来重新思考涉及多方的商业流程。工作流,是指工作程序自动化的过程,作为工作流(workflow)的区块链非常复杂,但它的商业价值值得肯定。其中,最为困难的是让工作流正式化的过程,因为这需要我们对多方的信息交流、真假鉴定、事故问责和异常应对达成一致意见。在一个组织中,它被称为“数据库模式设计”或“业务流程重构”,如果数据源自外部,就称为“数据清理”,它们都复杂且耗资巨大。

为了让工作流正常运转,利益相关方必须协商好相关事宜,如属性、订单数量、库存等细节,以及它们在通常情况与可能的异常状况下的运作模式;此外还要统一流程操作的验证方式。区块链工作流要面对并发性、故障、不确定性和交互等等多重的问题。要记住区块链虽然被炒作为“智能合约”,但它并不能解决上述这些复杂的问题。

微软研究院AI头条
微软研究院AI头条

专注科研19年,盛产黑科技

产业大数据区块链物联网政策计算机技术
1
相关数据
微软亚洲研究院机构

微软亚洲研究院于1998年在北京成立,是微软公司在亚太地区设立的基础及应用研究机构,也是微软在美国本土以外规模最大的一个研究院。微软亚洲研究院从事自然用户界面,智能多媒体,大数据与知识挖掘,人工智能,云和边缘计算,计算机科学基础等领域的研究,致力于推动计算机科学前沿发展,着眼下一代革命性技术的研究,助力微软实现长远发展战略。通过与微软产品部门紧密合作,微软亚洲研究院将众多创新技术转移到了微软的核心产品中,如Office、Windows、Azure、Bing、Visual Studio、Xbox Kinect以及小冰、Cortana和Microsoft Translator等人工智能产品。

https://www.msra.cn/
微软机构

微软是美国一家跨国计算机科技公司,以研发、制造、授权和提供广泛的计算机软件服务为主。总部位于美国华盛顿州的雷德蒙德,最为著名和畅销的产品为Microsoft Windows操作系统和Microsoft Office办公室软件,以及Xbox的游戏业务。微软是美国《财富》杂志2015年评选的世界500强企业排行榜中的第95名。

https://www.microsoft.com/en-us/about
区块链技术

区块链是用分布式数据库识别、传播和记载信息的智能化对等网络, 也称为价值互联网。 中本聪在2008年,于《比特币白皮书》中提出“区块链”概念,并在2009年创立了比特币社会网络,开发出第一个区块,即“创世区块”。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

重构技术

代码重构(英语:Code refactoring)指对软件代码做任何更动以增加可读性或者简化结构而不影响输出结果。 软件重构需要借助工具完成,重构工具能够修改代码同时修改所有引用该代码的地方。在极限编程的方法学中,重构需要单元测试来支持。

比特币技术

比特币是一种用去中心化、全球通用、不需第三方机构或个人,基于区块链作为支付技术的电子加密货币。比特币由中本聪于2009年1月3日,基于无国界的对等网络,用共识主动性开源软件发明创立。比特币也是目前知名度与市场总值最高的加密货币。 任何人皆可参与比特币活动,可以通过称为挖矿的电脑运算来发行。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

自动驾驶汽车技术

自动驾驶汽车,又称为无人驾驶汽车、电脑驾驶汽车或轮式移动机器人,是自动化载具的一种,具有传统汽车的运输能力。作为自动化载具,自动驾驶汽车不需要人为操作即能感测其环境及导航。

数据清理技术

数据清理(data cleansing)指删除、更正数据库中错误、不完整、格式有误或多余的数据。数据清理不仅仅更正错误,同样加强来自各个单独信息系统不同数据间的一致性。专门的数据清理软件能够自动检测数据文件,更正错误数据,并用全企业一致的格式整合数据。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

数据管理技术

数据管理是利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程,其目的在于充分有效地发挥数据的作用。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

操作系统技术

操作系统(英语:operating system,缩写作 OS)是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的内核与基石。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

推荐文章
暂无评论
暂无评论~