24 年前的香农专访:一个顽皮的科学巨匠,信息论之父

克劳德·香农是美国著名的数学家、电子工程师,他开创性的研究奠定了现代数字通信的理论基础。2016 年 4 月份是他的百年诞辰纪念月,为表纪念,IEEE Spectrum 重新发表了前 Spectrum 编辑 John Horgan 于 1992 年对香农的人物专访。这篇专访为我们揭示了香农性格的多个侧面:除了是广为人知的信息理论之父,他还是一位投资人、发明爱好者、解谜爱好者和爱搞恶作剧的人。1992 年的这篇专访中包含了一幅由波士顿摄影师 Stanley Rowin 拍摄的香农肖像。在这篇文章里,IEEE Spectrum 还重印了由 Rowin 拍摄、 Spectrum 从未发表过的香农照片。在与阿尔兹海默氏病抗争了很长一段时间后,香农于 2001 年逝世,享年 84 岁。他被认为是有史以来最伟 大的电子工程英雄之一。

真正的克劳德·香农是什么样子?一个拜访者来到波士顿城外一幢用灰泥粉饰过的宅邸 Entropy House,那里就是香农和他的夫人 Betty 住了三十年的地方。对这个问题,你在不同的房间里可能得到不同结论。在一间老旧却整洁的房间里,成排摆放的奖章庄严地印证着香农数不胜数的荣誉,其中包括 1996 年获得的美国国家科学奖(the National Medal of Science)、有日本「诺贝尔」奖之称的京都奖(the Kyoto Prize)和 IEEE 荣誉奖章(IEEE Medal of Honor)。

另一个房间里,珍藏着香农的著作。AT&T 贝尔实验室研究执行总监 Robert W. Lucky 将其工作称为「载入史册的科技思想(in the annals of technological thought)」, IBM 院士 Rolf W. Landauer 称香农「极具开创性的洞察力(pioneering insight)」的可等同于爱因斯坦。香农,作为 1948 年加入贝尔实验室的年轻工程师,定义了信息理论。在《贝尔系统技术杂志(the Bell System Technical Journal)》发表了一篇极富才气的论文后,他建立了电子数据高效打包和传输的知识框架。这篇题目为《通信的数学理论(A Mathematical Theory of Communication)》论文,现在仍然是通信时代的「大宪章」。

然而在给访问者展示他的奖品时,这位 75 岁有着一头蓬乱雪白头发、笑起来像精灵一样的老头,竟然感觉不好意思。在不安的一分钟后,他窜入了隔壁的另一个房间。这个房间放着装裱好的证书,其中一个将香农称为「玩杂耍的博士(doctor of juggling)」。它也被整齐排放在堆满各种小发明的桌子上。

Mjc0NzYzOA.jpg

香农用了很多年收集到其中的一些宝藏,比如会说话的下棋机、百刃折叠刀、电动弹簧单高跷和数不清的乐器。里面也有他自己创造的:有三个小丑的微缩舞台、一个能在迷宫中自己找到出口的机械老鼠、喜剧演员  W.C. Fields 的杂耍模型和一个能够计算罗马数字的名为 Throbac(Thrifty Roman Numeral Backward Computer )的计算机。香农曾试图让模型 W.C. Fields 表现真人的喜剧能力,但是最终落空了。「我爱建造机器,但是总是维修它们真的很难,」他有点不满足地说。

这个装满小发明的房间揭示了香农的其他侧面:这样的他会边用四个球玩着杂耍,边骑着独轮自行车穿行在贝尔实验室大厅里。这样的他发明了装有火箭发动机的飞盘,设计了「读心术(mind-reading)」机器。

这个房间代表了香农,一个为了寻找下棋机见解的人,开始在工作的时候下如此多的象棋。据前同事说,「至少一位监管员某种程度已近开始担心了」。

香农并没有感到歉意。「在我追寻自己兴趣爱好的时候,很好会考虑它最终的价值或对世界的价值。」他高高兴兴的说,「我在很多完全无用的事情上花费了很多的时间。」

《金甲虫》的影响

香农对数学抽象概念和小玩意的兴趣早早就萌发了。他成长于密歇根州的盖洛德,那里离他 1916 年出生的地方不远。那时,他就开始玩弄玩他爸爸(遗嘱检验法官)给的无线电套件和安装工具组合。他还沉迷于解答他最终成为数学教授的姐姐 Catherine 给他的数学谜题。

「当我还是一个孩子的时候,就对密码学和此类东西感兴趣。」香农说。他最爱的故事是埃德加·爱伦·坡写的推理小说《金甲虫》,这是爱伦·坡鲜有幸福结局的小说:通过解密一个神秘地图,英雄最终找到了埋藏的宝藏。

作为密歇根大学(位于安阿伯市)的毕业生,香农获得了数学和电子工程两个学士学位。他对这两个领域的精通使他成功成为了麻省理工学院的研究生。 在与 Amos Joel(这一领域的著名专家,在贝尔实验室工作) 就复杂的电话交换线路进行讨论后,他在自己的硕士论文里论述了由90 年代中期、英国数学家 Amos Joel 发明的一个代数结构如何在电子线路中表达开关和继电器。

克劳德·艾尔伍德·香农

生日:1916 年 4 月 30 日

出生地:密歇根州佩托斯基市

身高:178 厘米

体重:68公斤

幼年崇拜的英雄:托马斯·爱迪生

第一份工作:西联汇款的信差

家庭情况:妻子是Mary Elizabeth (Betty) Moore;三个孩子分别为 Robert J., 电脑工程师;Andrew M., 音乐家;Margarita C., 地质学家

学历:1936年学士,密歇根大学;1940年硕士、博士,美国麻省理工学院

爱好:小发明、杂耍、独轮车

最喜欢的发明:W.C. Fields 杂耍机器人

最喜欢的作家:T·S·艾略特

喜欢的音乐:迪克西兰爵士乐

喜欢的食物:放巧克力酱的香草冰淇淋

会员资格和奖项:IEEE(国际电子电力工程协会)会士、美国国家科学院成员、美国文理科学院成员;1966 年 IEEE 荣誉勋章;1966 年美国国家科学奖章;1972 年哈维奖;1985 年京都奖

最喜欢的奖项:1940 年硕士论文获美国电气工程师学会奖

这篇由 22 岁学生所做的论文影响深远:电路设计能在建造前被数学性地测试,而不是通过冗长的试验和错误来验证。工程师现在能够在布尔代数的帮助下照章设计电脑硬件和软件、电话网络和其他复杂系统。

香农的论文被称为「本世纪可能最重要的研究生论文,」但是香农,显然将它轻描淡写了。「这只是碰巧,因为没有其他人在两个领域都熟悉,」他说。他沉思了一会,补充说,「我已经永远地爱上了这个词,『布尔』。」

在 1940 年获得博士学位(他的博士毕业论文讨论了遗传传递的数学运算)后,香农在新泽西州普林斯顿的高等研究院(the Institute for Advanced Study)呆了一年。这时香农明显降低了说话的声音,他回忆了当他在研究院做演讲时,传奇人物爱因斯坦从房间的后门突然进来。爱因斯坦看着香农,在与另一位科学家接耳说完话后就离开。在演讲结束后,香农冲向刚才那位科学家询问爱因斯坦说了什么。这位科学家严肃地告诉他这位伟大的物理学家「想要知道茶在哪里。」说完后,香农就爆笑了起来。

你怎么拼写「有了!(Eureka)」?

香农在 1941 年去了贝尔实验室,之后在那里呆了 15 年。在二战期间,他参与了开发数字加密系统的团队,其中的一个系统被丘吉尔和罗斯福用来开跨洋会议。

就是这个工作,香农说,引导他发展自己的信息理论。他意识到,数字编码能够在侦探的眼睛下保护信息,那也能够在静电和其他形式的干扰下保护信息。这些编码也能够用于更高效地打包信息,从而让更多的信息通过既定通道传输。

「我的第一个(关于信息理论的)想法,」香农说,「是如何在噪声渠道里最好的改善信息传输。这是一个特殊的问题,因为那时你可能正想着电报系统或者电话系统。但当你想这个问题时,你脑海中可能就对所有广泛的应用有了概念。」被问及是否在某一个时刻他有了「Eureka」似的闪电灵感,香农用下面这句话侧面回答了这个过分简单的问题,「我本该有过,但是我不知道如何拼写那个词。」

香农在 1948 年的论文里对信息的定义对其通论理论非常的重要。回避了关于意义(他曾强调他的理论「不能也不曾打算解决意义问题」)的问题,香农表明信息是一个可测量的商品。他表示,给定消息中的信息量,除了可能被传送的消息,由被选中的特定消息的或然率决定。

他将系统中全部的信息能力定义为熵,熵这一概念来自于热力学所表达的系统的无序程度,或者物理学家称之为「混乱程度」。(伟大的数学家和计算机理论家 John von Neumann 说服了香农使用「熵」这个词。von Neumann 认为,没有人知道什么是「熵」这一事实,将在信息理论的辩论中给香农优势。)

香农定义了信息的基本单位,也就是是贝尔实验室的 John Tukey 衍生出的二进制单元,然后是比特,作为一个或两个状态的信息表达。一个人能够在相对较小的比特中编码大量信息,就像在古老的游戏《二十个问题》中,一个人能够就通过灵巧的询问快速调整归零得到正确答案。

基于这个数学基础,香农展示了任何给定的通信通道都有可信赖传输信息的最大承载量。事实上,他表示一个人可以通过高明的编码去接近这个最大值,但永远不能完全达到这个最大值。这个最大值也就是熟知的香农极限。

香农 1948 年的论文显示了如何计算香农极限——但并不知道如何接近那个极限值。后来,香农和其他一直在挑战这个问题。第一步是消除信息冗余。就像一个说话简洁的罗密欧仅仅用「i lv u」几个字表达信息,好的编码首先将信息压缩到最高效的模式。

去除足够冗余之后,一个所谓的误差修正编码加进来,从而保证分拆信息不会被噪声淹没。举例来说,一个误差修正编码处理数字流时,可能会加入一个多项式方程,保证所有的数字落到方程式上。接收端的译码员知道偏离方程式的任何数字在传送中是被改变了。

Aaron D. Wyner 是 AT&T 贝尔实验室(位于美国新泽西州默里希尔市)通信分析研究部的负责人。他指出,一些科学发现追溯起来只是那个时代不可忽视的产品,但香农的不是这样。

事实上,香农的想法过于有先见之明,以至于不能产生即刻影响。1948 年加入贝尔实验室的 Edgar Gilbert 说,「实验室里很多实际操作的人认为,这是一个有趣却不非常有用的理论。」。他的一部分工作就是和香农一起完成的。简单来说,真空管电路处理不了接近香农极限所需的复杂编程,Gilbert 解释。香农的论文甚至受到来自伊利诺伊大学香槟分校的 J. L. Doob 的负面评论。Historian William Aspray 也指出在那个年代,在任何事件中,香农的概念框架都不适用于信息理论应用。

直到 20 世纪 70 年代,伴随着高速集成电路的出现,工程师们开始全面利用信息理论。就算在今天,香农的见解也无形中帮助构建了储存系统、处理系统、数字化信息传送系统,从紧密的磁盘到超级计算机,从传真机到外太空探索(如旅行者号探测器)。

洛杉矶南加利福尼亚大学的电器工程师、美国电气与电子工程师协会信息理论学会(IEEE Information Theory Society)前会长 Solomon W. Golomb 认为,香农的影响未被夸大。「就像文学领域说字母表的发明对人的影响多么重要一样,」Golomb 评论到。

Mjc0NzY0MA.jpg

信息理论和信仰

然而,尤其是早些时候,信息理论迷住的人群比想象的要多的多。在语言学、心理学、经济学、生物学、甚至音乐和艺术领域的人都开始融合信息理论到他们的科目中。

John R. Pierce 是香农以前的同事,同时也是加利福尼亚斯坦福大学的荣誉退休教授。他就将信息论的「普遍滥用(widespread abuse)」对比成其他两个意义深远、遭受诸多误解的科学思想:海森堡的不确定性原理(Heisenberg’s uncertainty principle)和爱因斯坦的相对论。

一些物理学家走了非常长的路去论证信息理论的熵在数学上等同于热力学熵。结果证明那是真是的,但却无关紧要,据香农前同事、贝尔实验室的老将 David Slepian说,他在信息编码领域也非常有影响。Slepian说,许多工程师也「还真正理解这一理论就跳进乐队花车」。香农的著作激发了 1956 年美国电子工程师协会信息理信息理论学会的成立,其他致力于经济、生物系统、和其他应用的下属学会也快速成立。在 20 世纪 70 年代,美国电机及电子工程师学会会刊信息理论版(the IEEE Transactions  on Information Theory)发表了一篇社论,题目为《信息理论,光合作用和宗教》谴责了对香农理论的过度外延。(编者按:事实上,这篇 Peter Elias 的社论标题为《两篇著名的论文》,发表于 1958 年 9 月。)

香农同样怀疑一些对他理论的使用,同时,他也做着自己的研究。在 20 世纪 50 年代,他做了一个关于语言冗余的家庭实验,参与的有:香农的太太,贝尔计算机科学家 Betty ;另一个贝尔科学家、IEEE 前会长 Bernard Oliver 以及 Oliver 的妻子。试验中,一个人提供一个词的开头几个字母,或者提供句子里的单词,然后其他人将会试着猜测剩下的是什么。香农也指导了贝尔实验室的一个实验,实验里工作人员对文本中不同字母出现的次数进行统计、排序。

此外,香农建议将信息理论应用到生物系统中,因为应用到这一领域至少没那么牵强附会。「神经系统是一个复杂的交流系统,并且它用复杂的方式处理信息,」他说。当问到他是否认为机器能够「思考」时,他回答道:「当然啦。我是一个机器,你是一个机器,我们都思考,不是吗?」

确实如此,香农在信息理论的研究和他对小发明的喜爱了导致他早早产生了对智能机器的迷恋。香农是最早提议计算机与人类下棋的科学家之一;在 1950 年,他为《科学美国人》写了一篇文章,解释如何完成这一任务。

香农并不只是限制于象棋。他还建造了一个能够玩硬币配对(the game of penny-matching)游戏的「读心」机器,在这个游戏中,一方猜测另一方选择了正面或反面。香农在贝尔实验室的同事 David W. Hagelbarger,开发了这个机器的原型;这个机器记录并分析对手过去的选择,从而找寻规律,预测接下来的选择。因为人类总是会陷入到一种模式中,机器在那个时候已经有了超过 50% 的胜率。之后,香农建造了自己的机器版本,对 Hagelbarger 的机器进行了挑战,成就了如今的一场传奇决斗。

他还构建了机器能够早桌游 Hex 上打败任何人类,在那个年代,Hex 在数学圈内非常流行。事实上,香农自定义了这个桌球游戏,让人类一方能得到更多的 hex。为了获得胜利,机器要做的就是拿到中心 hex,然后匹配对手的路数就行。

机器可以立刻移动。但是为了表达出机器在思考下一步,香农给它的电路增加了一个延时开关。才华出众的哈佛大学数学家 Andrew Gleason,曾与这个机器进行了挑战, 言称没有机器能打败他。而当 Gleason 被虐得体无完肤,仍要求再次挑战时,香农才告诉他自己机器的秘密。

1950 年,香农制造了一个机器老鼠,在没有协助的情况下能够学习如何通过迷宫,最终找到奶酪。香农将其命名为「Theseus」(忒修斯,希腊神话中的英雄,为解救希腊的童男童女,自告奋勇到克里特岛除掉弥诺陶洛斯),最终除掉 Minotaur 并找到了走出可怕迷宫的路。事实上,老鼠的「大脑」位于迷宫地板下的一堆真空管室中;电路控制着磁铁的移动,进而控制着老鼠的移动。

1977 年 IEEE Spectrum 的编辑给读者出了个难题:创造一个可以通过试错法走出迷宫的微型老鼠,它的大脑是独立的外接电脑,能从之前的错误中吸取经验,当再次通过相同的迷宫时,不允许出错。一位香农之前同事告诉编辑 ,香农早在二十多年前就已经创造了一个类似的微型老鼠。

考虑到五十年代的技术难以达到相应的水平,编辑因此电话联系了香农。香农开玩笑说,他用这个「智能老鼠」骗了全国各地很多人。窗帘附近的桌子下藏着真空管和丝杠是至关重要的。他轻笑道。1979 年,当 Spectrum 隆重地为神奇的微型老鼠迷宫竞赛颁奖时,香农把 Theseus 从阁楼中取下,装进他的旅行车中。将它展示给竞争微型老鼠的人观看。

当被问及人工智能的前景时,香农指出在当时计算机尽管拥有超强的运算能力,但在处理原始信息方面还没达到人类智能的水准。他认为仅仅在机器复制人类的视觉能力方面就已经是一项相当艰巨的任务了。但是,他补充道:「我认为,几十年后机器智能超越人类是完全可以预期的。」

杂耍的统一场论

1956 年,香农离开了他在贝尔实验室的终身职位(后来的十多年间,他仍保留着会员资格),成为了 MIT 通信科学系的教授。后来的几年里,他痴迷于杂耍。并且制造了几台杂耍机,还构想了所谓的「杂耍统一场论」:如果 B 代表球的数量,H 代表手的数量,D 表示球在手中度过的时间,F 则代表着每个球的飞行时间,E 代表每只手不拿球的时间,那么B/H=(D+F)/(D+E)。(不幸的是,该理论并不能帮助香农同时扔四个以上的球,他辩解称是他手小的缘故。)

他在诗歌领域也有所涉猎。他的作品中有一篇向 Rubik’s Cube 致敬的诗歌。(也即magic cube,魔方),一个风行于 20 世纪 70 年代末的玩具。「论魔方之规则」,定下了诗的韵格,「Ta-Ra-Ra-Boom-De-Aye。」诗曰:

敬汝魔方常净,涂之以凡士林。

须谨记兮拇指,手胼胝而指滞。

不外借且不求,野夫转其两际。

唯不可接受者,茫然兮不得解。

茫然不可解兮,且其可怪也欤?

纵你勤且持,其解茫然不可寻。

香农自己有一种避免「不可解」窘境的天赋, 根据曾在 MIT 师从香农并和他合著论文的Elwyn Berlekamp 的说法,「总有很多无关紧要的但可解的问题,和一些影响重大却无解的问题。香农总有一种神秘的本能和能力,可以想出那些影响重大的问题的解决办法。」

然而,20 世纪 50 年代末,香农在信息论领域成果寥寥。一些前贝尔实验室的同事认为香农到MIT的时候已经精疲力尽而且对他所创造的领域感到厌倦了。

但是香农否认了这种看法。他说,他在整个六十年代都在持续研究信息论领域的各种问题,尽管他觉得他的多数调查没有重要到可以发表的程度,但也还是发表了一些论文。香农提出「许多伟大数学家在年轻的时候就已经完成了生命中最重要的研究。」

在六十年代,香农也不再出席由他创造的领域的专业会议。 Berlekamp 提出了一个可能的解释。据他回忆,1973 年,他说服了香农在国际信息论研讨会上作第一次年度香农讲座。但是香农几乎是在临近开始的前一分钟退却了。Berlekamp 说「我从没有见过像他那样怯场的人。听众们对他敬若神明。我想,他大概担心他不能像他显赫的名声一样满足崇拜者的期望吧。」

Berlekamp 说香农最终做了一个鼓舞人心的演讲,他预见了一些有关宇宙反馈和自然界自我指涉的观点。

尽管如此,香农再次消失在公众的视野中。近年来,受到妻子的鼓励,香农开始出现在一些小型会议上,同时参观一些开展信息论研究的实验室。

1985 年,他在出人意料地出现在英国布莱顿举办的国际信息论研讨会上。此前会议开展得十分顺利,当说明那个带着羞涩微笑在会议上踱步的白发老人正是克劳德·香农的消息传遍大厅和会议室时,会议上很多人甚至不知道香农仍然在世。

宴会上,会议组织者终于说服香农为听众致辞。他讲了几分钟——担心他的听众厌倦,他后来回想起——然后,从他的口袋里拿出三个小球,玩起了杂耍。观众兴高采烈地喝彩欢呼,然后依次排开,索要签名。 Robert J. McEliece 是加州科技研究院的电力工程教授,同时也是会议主持人,他说:「就好像牛顿出现在了物理学会议一般。」

理论人物信息论克劳德·香农专访产业
机器之心
机器之心

机器之心编辑

返回顶部