J.C.R. Licklider 小传
约瑟夫·利克莱德(J. C. R. Licklider;1915年3月11日-1990年6月26日),是美国心理学家和计算机科学家,被认为是计算机科学和通用计算机历史上最重要的人物之一。
他是最早预见到现代交互计算(Interactive computing)及其在各种应用的人之一;也是互联网的先驱,早在全球计算网络建成之前,就有了这样的远见。他为此做了大量工作,资助了很多研究,包括当今标准图形用户界面(graphical user interface),以及互联网的直接前身阿帕网。
他被称为“计算机界的约翰·查普曼”(computing's Johnny Appleseed),因为他在数字时代播下了计算的种子;施乐帕洛阿尔托研究中心计算机科学实验室和数字设备公司系统研究中心的创始人罗伯特·泰勒指出,“计算机技术的大部分重大进步——包括我的团队在施乐帕洛阿尔托研究中心所做的工作——仅仅是对利克设想的推断。所以他是这一切的起点”。
最近着迷于计算机历史,连读了几本相关的书 The Innovators, The Information, Possiplex 然后是 The Dream Machine。看完 The Dream Machine之后,发现脑海中的知识越来越紧密的联系了起来,像是一个一个原本分散的神经元互相打通,这种感觉很神奇。Connecting the dots 说的也许就是这种感觉吧。同时我也思考为什么这样的知识点之间的联系如此重要和巧妙,却难以描述或传递给他人。不由的感到人类语言的限制性,毕竟语言本身是线性的,只能从一个方向到另一个方向,语言本身在传递相互关联的知识点时是非常无力的。
虽然用文字难以表达出脑海中的知识模型,我还是想在这里将的有意思的点描述清楚,希望能帮助你将它们联系起来,也希望给你带来启发。同时我也在构想计算机作为表达的媒体能够做的还有很多很多,远远超过单纯的文字,希望有机会能够将这个构想实现,也希望和同样感兴趣的朋友一起讨论。 在了解这些计算机历史之后,我惊讶的发现这段历史在中国的出版物上居然都没有的。我所看到的这几本书中,有中文版的仅有 The Information 这一本 (中文叫做 信息简史)。所以我想通过连载的形式从设计师的角度出发,来介绍一下这段历史中有趣的片段。
Walter Isaacson 在 The Innovators 一书中最前面列了一个时间线,将计算机历史上的重要人人物按照时间排序一一列出。这里我选了一些印象深刻的:
Ada Lovelace, Charles Babbage, Vannevar Bush, Alan Turing, Claude Shannon, John von Neumann, William Shockley, Robert Noyce, Gordon Moore, J.C.R Licklider, Doug Engelbart, Ted Nelson, Stewart Brand, Bob Taylor, Alan Kay, Bill Gates, Steve Jobs, Tim Berners-Lee, Larry Page and Sergey Brin, Jimmy Wales, Ev Williams
作为产品设计者,对我影响最大的是 J.C.R Licklider, Doug Engelbart, Ted Nelson, Alan Kay, 当然还有的 Steve Jobs。希望你记住这些名字,本文只是是一个很长的故事的开始。
Licklider 人生经历
Licklider 出生于1915年,本科毕业于圣路易斯的华盛顿大学,获得三个学位,物理、数学和心理学,随后又多呆了一年获得了心理学的硕士。1942年博士毕业于罗彻斯特大学心理声学专业 psychoacoustics,随后7年一直在哈佛大学的心理声学实验室工作。之后1950年他对信息技术和计算机非常感兴趣,并换到MIT任职副教授。
如果单独看他后来的工作和成就,Lick (Licklider 被人简称为 Lick) 早年对心理学的热情似乎是一个人生的偏差,一个副业。但事实上正是他的心理学基础造就了他对计算机的核心观念。在那个时代,所有其他的计算机先驱都是来自于数学、物理、或者电子工程这些的技术主导的学科,这导致了他们仅关注于科技本身,比如让机器变得更大、更快、或者更可靠。Lick 的独特之处在于对人的本身能力的高度欣赏:我们感知 (Perceive)、适应 (adapt)、做选择 (make choice)、和对看起来棘手问题能够设想出全新的解决方式的能力。
在他接触计算机的时候发现,当涉及到那些计算机做的非常好的领域比如死记硬背的、算法的、数据排序的等等方面,人类慢的可怜而且错误率很高。这方面绝大部分人都会被最简单的计算器秒杀。而当涉及到计算机做的不太好的地方,比如说感知、设定目标、做判断、洞察 等等所有的直觉处理能力,我们人类远超于世界上最强大的机器 (现在仍然如此)。他发现人类的所擅长的和计算机所擅长的可以形成一个近乎完美的互补关系。所以 Lick想,如果你把人和计算机放在一起形成一个系统会如何?如果我们将所有的枯燥的、算术的、繁杂的工作都交给擅长于此的计算机,你能够剩下多少真正用在创造性工作上的时间?
Lick 认为人类应该和计算机进行交互 (interact), Licklider 可以说是现代的人机交互学科 HCI 的开创者。如果你在做产品或交互设计,那就必须要了解 Licklider。那个时代的计算机都是批处理的模式 (Batch processing) 。人给计算机一对提前准备好的穿孔卡片,告诉它怎么操作,然后等上数小时之后计算机给出结果。当时的企业比如 IBM 对人机交互一点兴趣都没有,当时IBM的产品开发部门认为计算机的市场根本不重要,他们想要将公司的资源放在真正赚钱的地方:开发更好的穿孔卡片制表机 (tabulators)。
1960年发表了他的开创性的论文 “Man Computer Symbiosis” (人与电脑的共生,下文有),这篇文章本质上列出了美国计算机研究领域未来25年甚至到现在的愿景和计划。文种主要的观点是计算机的研究目标应当是让人和计算机能够共同合作,一起做决定、一起控制复杂的状况。其中 “共生” 这个概念非常重要,Symbiosis 指的是 “不同种类的生命,形成非常紧密关联的,共存的关系”。这与现在常听到的计算机或者人工智能代替人类思考的方向是完全不同的。“共生” 意味着人类和计算机以合作的方式共同工作,各自做自己所擅长的东西:人类设定目标,并且提供动机…… 人要建立假设情况、提出问题…… 人们要进行原理性的、程序的和模型化的思考… 人要负责制定标准,并作为判断条件、判断机器的贡献并且指导思路… 而计算机应该将假设转变成可以测试的模型。它们可以模拟过程和模型、执行程序并将结果反馈给操作者。它们将会转换数据、绘制图表。它们会将精致的等式或者逻辑描述转换成动态的模型,这样人类操作员可以观察系统的动态行为。
Licklider 相信有一天,计算机会变得人性化 (humane) 和亲密化 (intimate),它们能够回应人并为人提供帮助。它们可以作为新的表达媒介,它们可以让信息获取更加民主,培养更广阔的社区,建立一种全球共通的交流机制、新的商业和合作。最终,机器和人类形成一种共生 (symbiosis) 状态,形成一个紧密凝聚的整体,这个整体的思考能力将会比任何人类自身都强大,而处理数据方面又比任何独立的机器自身更强大。
在一次试验中 Lick 测试了他自己在工作时候的时间分配,他发现 :
大约 85% 的“思考”时间都花在了让自己处于能够思考的状态,花在了做决定,花在学习需要知道的知识上。更多时间是花在了寻找和获取信息上而不是消化吸收信息上。绘图本身就要花费几个小时,指导助理如何绘图又要花几个小时,当图最终绘制完成时,其中表达的关系就显而易见了,但是必须通过漫长绘制过程再能得到最后的结果 ……“在整个测试过程中,我的 “思考” 时间集中于文书类或机械类的活动:搜索、计算、绘图、转换、判断一系列假设所引导的逻辑和结果、为一个决定或者启发做准备。而且我对尝试什么和不尝试什么的选择很大程度上取决于文书工作的可行性而不是智力上的才能。Man-Computer Symbiosis (J. C. R. Licklider, IRE Transactions on Human Factors in Electronics, volume HFE-1, pages 4–11, March 1960)
这个百分之85 不单震惊了 Lick,而且似乎给了他一个顿悟 (Epiphany):
Our minds were slaves to mundane detail, and computers would be our salvation.We and they were destined to unite in an almost mystical partnership: thinking toghther, sharing, dividing the load. Each half would be preeminent in its own sphere-rote algorithms for computers, creative heuristics for humans. But together we would became a greater whole, a symbiosis, a man-machine partnership unique in the history of the world (The Dream Machine 149)
人和电脑的共生能够 把人们从世俗的任务中解放出来从而提高人的智力。Lick的这篇论文影响了后来的 Doug Enelbart 和 Alan Kay 的思想和他们后来的所致力于研究的方向。
1962年,Lick 被任命为美国国防部的 Advanced Research Projects Agency (ARPA) 的IPTO部门的头儿,他的主要任务就是让计算机实现更多的用途,并且资助全美国最好的学校或研究机构让他们进行计算机领域的研究。Lick开玩笑的将它的这些组织取名为 超星际计算机网络 Intergalactic Computer Network ,他故意取了这么个宏大的名字因为当时他没有期望马上实现这个设想。而这些研究小组最终发展成了Internet 的前身 ARPANET。Lick 那时候的愿景是将全世界的信息都通过网络联系在一起,你可以使用远距离的计算机,也可以从远距离计算机获取数据。这个愿景可以说是 Lick 首创,在那时候没有人能看到这一点。Lick 在60年代初电脑文明的开始就看到了这个愿景。如今50多年过去,他的愿景在现代仍然很有启示和新的发现。同样,若从现在看起,能有什么思想能在50年的时候仍可以称为 “具有前瞻性” 的呢?
Licklider 的工作成就
心理声学
在心理声学领域,利克莱德最为人所知的是他在1951年发表的一篇论文《Duplex Theory of Pitch Perception》,这篇论文被引用了数百次,并在1979年的一本书中被重印,奠定了现代音高感知模型的基础。
半自动地面防空系统
20世纪50年代,在麻省理工学院,利克莱德致力于半自动地面防空系统(SAGE),这是一个冷战时期的项目,目的是创建一个计算机辅助防空系统。SAGE系统包括收集数据并将数据提交给操作员的计算机,然后操作员选择适当的响应。利克莱德是一名人体工学专家,这让他相信了人机界面的巨大潜力。
信息技术
利克莱德在职业生涯早期就对信息技术感兴趣。他的想法预示着图形计算、点击界面、数字图书馆、电子商务、网上银行和软件将存在于一个网络上,并在任何需要的地方迁移。就像万尼瓦尔·布什(Vannevar Bush)一样,利克莱德对互联网发展的贡献是由想法组成的,而不是发明。他预见到对具有简单用户界面的联网计算机的需求。
利克莱德在构思、资助和管理催生现代个人电脑和互联网的研究中发挥了重要作用。1960年,他关于“人机共生”(Man-Computer Symbiosis)的开创性论文预示了交互式计算,他继续资助分时系统和应用程序开发的早期工作,最著名的是道格拉斯·恩格尔巴特的工作,他在斯坦福研究所建立了增强研究中心,并创建了著名的在线系统,计算机鼠标就是在那里发明的。
他还为图书馆资源委员会做了一些开创性的早期工作,设想了未来图书馆的样子,他在1960年的论文中将其描述为“思维中心”(thinking centers)。
人机共生
在《人机共生》中,利克莱德概述了简化计算机与计算机用户交互的必要性。利克莱德被认为是控制论和人工智能(AI)的早期先驱,但与许多人工智能实践者不同,利克莱德从未觉得人类会被基于计算机的东西所取代。正如他在那篇文章中写道:“人会设定目标,提出假设,确定标准,并进行评估。计算机将完成必须完成的可程序化的工作,为技术和科学思维的洞察和决策铺平道路”。这种侧重于有效利用信息技术增强人类智能的方法有时被称为智力放大(Intelligence amplification)。
Project MAC
1962年至1964年期间,他担任ARPA信息处理技术办公室(IPTO)主任,他在麻省理工学院资助了Project MAC。一台大型主机被设计成可以同时由30个用户共享,每个用户坐在一个独立的“终端”上。
全球计算网络
在构思和资助早期网络研究方面,利克莱德扮演了类似的角色,最著名的是阿帕网。1962年8月,在BBN的一系列讨论“星际计算网络”(Intergalactic Computer Network)概念的备忘录中,他提出了全球计算网络的最早构想。这些想法包含了当今互联网的几乎所有东西,包括云计算。
在IPTO的时候,他说服了伊凡·爱德华·苏泽兰,罗伯特·泰勒,和劳伦斯·罗伯茨,无所不包的计算网络是一个非常重要的概念。
1967年,利克莱德向卡耐基教育电视委员会提交了一篇名为《Televistas: Looking ahead through side windows》的论文。这篇论文描述了一种与电视“广播”模式的彻底背离。相反,利克莱德提倡双向通信网络。卡耐基委员会促成了公共广播公司的成立。尽管委员会的报告解释了这一点,“利克利德博士的论文是在委员会得出自己的结论之后完成的,”约翰逊总统在《1967公共广播法》的签署仪式上说,“所以我认为我们必须考虑新的方法来建立一个伟大的知识网络,它不仅是一个广播系统,而且是一个采用各种方式发送和存储个人可以使用的信息的系统。”
他在1968年发表的论文《The Computer as a Communication Device》阐述了他对网络应用的设想,并预测使用计算机网络来支持共同关心和协作的社区,而不用考虑位置。
Licklider协议是以他的名字命名的。
Licklider的理念:人机共生(Man-Computer Symbiosis)
编译自:利克莱德(J. C. R. Licklider)1960-03的Man-Computer Symbiosis
摘要
人机共生是人类和电子计算机之间合作互动的一个预期发展。这将涉及人类和电子设备之间非常密切的耦合。主要目的是
- 计算机促进公式化思维,因为它们现在促进了公式化问题的解决;
- 让人类和计算机能够合作做出决策和控制复杂的情况,而不依赖于预先确定的程序。
在预期的共生伙伴关系中,人类将设定目标,制定假设,确定标准,并进行评估。计算机将会做一些常规的工作,为人类在技术和科学思考方面的见解和决策做好准备。 初步分析表明,共生伙伴关系将比单独的人能更有效地进行智力活动。实现有效合作关系的先决条件包括计算机分时、内存组件、内存组织、编程语言以及输入和输出设备的发展。
1.介绍
1.1共生
无花果树只能由昆虫胚芽孢粉授粉。昆虫的幼虫生活在无花果树的子房里,它在那里获得食物。因此,树和昆虫是高度相互依存的:树不能和昆虫一起繁殖;昆虫不能在树上吃东西;它们共同构成了一种可行的、富有成效的、蓬勃发展的伙伴关系。这种合作性的“两种不同生物紧密联系在一起,甚至紧密结合”叫做共生。
人机共生是人机系统的一个子类。有许多人机系统。然而,目前还没有人机共生体。本文的目的是提出这一概念,并希望通过分析人机交互的一些问题,提请人们注意人机工程的适用原则,并指出一些需要研究回答的问题,从而促进人机共生的发展。我们希望,在不太长的时间内,人脑和计算机将紧密结合在一起,由此产生的伙伴关系将会认为,没有人脑能够以我们今天所知的信息处理机器所未有的方式思考和处理数据。
1.2在“机器增强的人类”和“人工智能”之间
作为一个概念,人机共生在一个重要的方面与North所称的“机器增强的人类”是不同的。在过去的人机系统中,操作员提供了主动性、方向、集成和标准。系统的机械部分只是扩展,首先是人的手臂,然后是人眼。这些系统当然不是由“生活在一起的不同生物”组成的。只有一种有机体——人,其余的只是为了帮助这个人。
在某种意义上,任何人造系统都是为了帮助人类,帮助系统外的一个或多个人。然而,如果我们关注系统内的操作人员,我们会发现,在某些技术领域,过去几年发生了巨大的变化。“机器增强”已经取代了人类,转向了自动化,留下来的人更多的是为了帮助,而不是得到帮助。在某些情况下,特别是在以计算机为中心的大型信息和控制系统中,人工操作员主要负责自动化不可行的功能。这种系统(North可能称之为“人类增强的机器”)不是共生系统。它们是“半自动”系统,系统最初是全自动的,但没有达到目标。
人机共生可能不是复杂技术系统的最终范例。在适当的时候,电子或化学“机器”似乎完全有可能在我们现在专门考虑的大部分功能上超过人脑。即使是现在,Gelernter的IBM - 704平面几何定理证明程序的进度也和布鲁克林高中学生差不多,并且犯了类似的错误。事实上,有几个理论证明、解决问题、下棋和模式识别程序,它们能够在受限制的领域中与人类的智力表现相媲美;而Newell、Simon和Shaw的“一般问题解决器”可能会消除一些限制。简而言之,避免与(其他)人工智能爱好者争论似乎是值得的,因为他们认为在遥远的未来只有机器的统治地位。然而,在此期间,主要的智力进步将会由密切合作的人和计算机来完成,这将会是一个相当长的过渡期。一个多学科的研究小组,研究了空军未来的研究和发展问题,估计在1980年之前,人工智能的发展使机器能够独自思考或解决具有军事意义问题。这将会导致,比如说,5年的时间来发展人机共生,15年的时间来使用它。15年可能是10年或500年,但那些年应该是人类历史上最具创造力和最激动人心的时期。
2.人机共生的目标
当今的计算机主要是为了解决预先设定的问题或者按照预定的程序处理数据。计算过程可能取决于计算过程中获得的结果,但是所有的替代方案都必须提前预见。(如果出现不可预见的替代方案,整个过程就会停止,等待程序的必要扩展。)预先制定或预先确定的要求有时并没有什么大的缺点。预先制定或预先确定的要求有时并没有什么大的缺点。人们常说,计算机的编程迫使人们要清楚地思考,它会规范思维过程。如果用户能够提前思考他的问题,那么与计算机的共生关系就没有必要了。
然而,许多可以提前思考的问题很难提前思考。通过一个直观的、由直觉引导的试错过程,会更容易、更快地解决问题,在这个过程中,与计算机进行合作,发现推理中的缺陷,或者揭示了解决方案中意想不到的变化。没有计算机辅助,其他问题根本无法解决。庞加莱预见到了一批重要的潜在计算机用户的沮丧,他说,“问题不是,答案是什么?,问题是,问题是什么”。人机共生的主要目的之一是将计算机有效地纳入技术问题的公式化部分。
另一个主要目标是密切相关的。这是为了有效地将计算机带入必须“实时”进行的思考过程,时间过快,不允许以传统方式使用计算机。想象一下,例如,试图在这样的时间表上借助计算机指挥一场战斗。你今天提出了你的问题。明天你和程序员一起度过。你会得到一张20英尺长的纸,上面写满了数字,这些数字并没有提供最终的解决方案,只是提出了一种应该通过模拟来探索的策略。显然,这场战斗将在其计划的第二步开始之前结束。与电脑互动的思维方式与你与一位同事互动的思维方式是一样的,他的能力补充了你自己的能力,这将要求人与机器之间的耦合比这个例子所建议的和现状可能的要紧密得多。
3.计算机参与公式化和实时思维的需要
前面的段落默认了这样的假设:如果可以有效地引入到思想过程中,数据处理机器所能执行的功能将会以一种重要的方式改进或促进思考和解决问题。这种假设可能需要正当理由。
3.1技术思维的初步和非正式工效分析
尽管有大量关于思考和解决问题的文献,包括对发明过程的大量历史案例研究,但我找不到比对从事科技企业的人的脑力劳动进行工效研究分析更好的东西。因此,在1957年的春天和夏天,我试着记录一个中等技术人员在他认为专注于工作的时间里所做的事情。尽管我意识到取样的不足,但我还是做了自己的研究对象。很明显,我所做的主要事情是保持记录,如果按照最初计划中设想的细节保存记录,这个项目将会变成一个无限倒退。不是。尽管如此,我还是获得了一张让我停下来的活动照片。也许我的范围不典型——我希望不是,但我担心是。
我85 %的“思考”时间都花在了思考、决策、学习一些我需要知道的事情上。寻找或获取信息的时间比消化信息的时间多得多。几个小时用于绘制图表,其他几个小时用于指导助手如何绘制图表。当图表完成后,两种关系立刻变得明显,但必须进行绘图以使其成为现实。在某一点上,有必要对语音清晰度和语音噪声比相关函数的六个实验测定值进行比较。没有两个实验者使用相同的语音噪声比定义或测量。需要几个小时的计算才能把数据变成可比的形式。当它们处于可比较的形式时,我只花了几秒钟就确定了我需要知道的东西。
简而言之,在整个研究期间,我的“思考”时间主要用于本质上是文书或机械的活动:搜索、计算、绘图、转换、确定一组假设或假设的逻辑或动态后果,为决策或洞察铺平道路。此外,我对尝试什么和不尝试什么的选择在很大程度上是出于对文书可行性的考虑,而不是智力能力的考虑,这令人尴尬。
刚刚描述的研究结果传达的主要建议是,在大多数时间里,被称为技术思维的操作都是机器可以比人类更有效地执行的操作。这些操作必须在不同的变量上以不可预见的和不断变化的顺序进行,这一事实带来了严重的问题。然而,如果这些问题能够以在人和快速信息检索和数据处理机器之间建立共生关系的方式得到解决,那么合作互动显然会大大改善思维过程。
在这一点上,也许应该承认,我们正在使用术语“计算机”来涵盖各种计算、数据处理以及信息存储和检索机器。这类机器的能力几乎每天都在增加。因此,对该类的功能进行一般性陈述是危险的。也许就人的能力发表一般性声明也同样危险。尽管如此,人类和计算机之间在能力上的某些基因型差异确实很突出,并且它们对可能的人机共生的性质和实现这种共生的潜在价值有着影响。
正如已经以各种方式所说的那样,人类是嘈杂的窄带设备,但是他们的神经系统有很多平行的同时活跃的通道。相对于人类来说,计算机速度非常快而且非常精确,但是它们一次只能执行一个或几个基本操作。人类很灵活,能够根据新收到的信息“不断地自我规划”。计算机是一根筋的,受其“预编程”的约束。人类自然会说冗余性的语言,这些语言围绕着单一的物体和连贯的动作组织起来,使用20到60个基本符号。计算机“自然”会说非冗余语言,通常只有两个基本符号,对单一物体或连贯动作都没有固有的鉴赏能力。
要严格正确,这些特征必须包括许多限定符。尽管如此,它们所呈现的不同(因此也是潜在的补充)本质上是正确的。计算机可以很容易、很好、很快地做许多对人类来说困难或不可能的事情,而人类可以很容易、很好地做许多对计算机来说困难或不可能的事情,尽管不是很快。这表明,共生合作,如果成功地融合了人和计算机的积极特征,将具有巨大的价值。当然,速度和语言的差异带来了必须克服的困难。
4.预期共生关系中人和计算机的可分离功能
似乎人类操作员和设备的贡献在许多操作中会如此完全地融合在一起,以至于在分析中很难将它们整齐地分开。情况就是这样;例如,在收集决策依据的数据时,人和计算机都从经验中找到了相关的先例,如果计算机随后提出了一个符合人直觉判断的行动方案。(在定理证明程序中,计算机在经验中找到了先例,在SAGE系统中,它们提出了行动方案。上述内容并不是一个牵强附会的例子。)然而,在其他行动中,人员和设备的贡献在某种程度上是可分离的。
当然,至少在早期,人类会设定目标并提供动机。他们将提出假设。他们会问问题。他们会想到机制、程序和模型。他们会记得,这样的人早在1947年,或者至少在二战后不久,就对一个感兴趣的主题做了一些可能相关的工作,他们会知道该主题可能在哪些期刊上发表。总的来说,他们会做出近似的、错误的、但领先的贡献,他们会定义标准并充当评估者,判断设备的贡献并指导总体思路。
此外,当这种情况确实出现时,人类会处理极低概率的情况。(在当前的人机系统中,这是操作员最重要的功能之一。极低概率替代方案的概率之和往往太大,不容忽视。)当计算机没有适用于特定环境的模式或程序时,人们会填补问题解决方案或计算机程序中的空白。
信息处理设备本身将把假设转换成可测试的模型,然后根据数据对模型进行测试(操作员可以粗略地指定这些数据,并在计算机将它们提交给他审批时确定它们是相关的)。这些设备将回答问题。它将模拟机制和模型,执行程序,并向操作员显示结果。它将转换数据,绘制图表(以人类操作员指定的任何方式“切蛋糕”,或者如果人类操作员不确定他想要什么,那就呈现几种替代方式)。设备将会插入、推断和转换。它将静态方程或逻辑语句转换成动态模型,以便操作员可以检查他们的行为。一般来说,它将执行可例行公事的文书工作,以填补决策之间的间隔。
此外,只要有足够的基础支持正式的统计分析,计算机将充当统计推断、决策理论或博弈论机器,对建议的行动方案进行初步评估。最后,它将尽可能多地进行诊断、模式匹配和相关性识别,但在这些领域,它将接受一个明显的次要地位。
5.实现人机共生的前提条件
在前一节中默认的数据处理设备是不可用的。计算机程序尚未编写。事实上,在非共生的当下和预期的共生未来之间存在着一些障碍。让我们研究一下其中的一些障碍,以便更清楚地了解需要什么以及实现这一目标的可能性。
5.1 人与计算机之间的速度不匹配
现在的大型计算机对于与一个人进行实时合作思考来说,速度太快,成本太高。显然,为了效率和经济,计算机必须在许多用户之间分配时间。分时系统目前正在积极开发中。甚至有一些安排来防止用户“破坏”除了他们自己的个人程序之外的任何东西。
在10年或15年后的一段时间里,设想一个“思维中心”似乎是合理的,它将结合当今图书馆的功能,以及信息存储和检索的预期进展和本文前面建议的共生功能。这种设想很容易放大成这样的中心网络,通过宽带通信线路相互连接,并通过租用线路服务连接到各个用户。在这样的系统中,计算机的速度将会平衡,巨大的存储器和复杂程序的成本将会除以用户的数量。
5.2 存储器硬件要求
当我们开始考虑将任何已知的技术文献存储在计算机存储器中时,我们会遇到数十亿比特数据,除非事情发生显着变化,否则将花费数十亿美元。
首先要面对的是,我们不会将所有的技术和科学论文都存储在计算机存储器中。我们可能会储存概括得最简洁的部分——数量部分和参考文献——但不是全部。书籍是现存最精美、最人性化的组件之一,在人机共生的背景下,它们将继续发挥重要的功能。(希望计算机能加快图书的查找、交付和归还。)
第二点是,存储器的一个非常重要的部分将是永久的:部分是不可擦除的内存和部分是发布的内存。计算机将能够一次写入不可擦除的内存,然后无限期地读取,但是计算机将无法擦除不可擦除的内存。(它也可能会重写,将所有的0变成1,就像在之前写的东西上做标记一样。)发布的内存将是“只读”内存。它将被引入到已经构建好的计算机中。计算机将能够重复引用它,但不能改变它。随着计算机越来越大,这些类型的内存将变得越来越重要。它们可以做的比核心、薄膜、甚至磁带存储器更紧凑,而且价格也要便宜得多。主要的工程问题将涉及选择电路。
就内存需求的其他方面而言,我们可以指望普通的科学和商业计算机的持续发展。存储元件有可能变得与处理(逻辑)元件一样快。这一发展将对计算机的设计产生革命性的影响。
5.3存储组织要求
人机共生理念中隐含着这样的要求,即信息可以按名称和模式检索,并且可以通过比串行搜索快得多的程序访问。至少有一半的内存组织问题似乎存在于存储过程中。其余大部分似乎都包含在存储机制或介质中的模式识别问题中。对这些问题的详细讨论超出了目前的范围。然而,简要概述一个有希望的想法,即“trie存储”,可能有助于说明预期发展的一般性质。
Trie存储是由其创始人Fredkin所称的,是因为它被设计成便于检索信息,并且因为分支存储结构在开发的时候类似于一棵树。大多数常见的内存系统在参数指定的位置存储参数的函数。(从某种意义上说,它们根本不存储这些参数。在另一个更现实的意义上,它们将所有可能的参数存储在内存的框架结构中。)另一方面,trie存储系统存储函数和参数。从标准的初始寄存器开始,参数首先被引入内存,一次一个字符。每个参数寄存器都有一个单元格,每个字符都有一个单元格(例如,两个用于二进制形式的信息),每个字符单元都有一个存储空间,用于下一个寄存器的地址。这个参数是通过写一系列地址来存储的,每一个地址都告诉我们在哪里找到下一个地址。在引数的最后,是一个特殊的“结束参数”标记。然后遵循函数的指示,该函数以多种方式中的一种或另一种方式存储,进一步的trie结构或“列表结构”通常是最有效的。
Trie存储方案对于小内存来说是低效的,但是随着内存大小的增加,它在使用可用存储空间方面变得越来越高效。该方案吸引人的特点是:
- 检索过程极其简单。给定参数后,输入第一个字符的标准初始寄存器,并提取第二个字符的地址。然后转到第二个寄存器,获取第三个寄存器的地址,等等。
- 如果两个参数具有相同的初始字符,则它们对这些字符使用相同的存储空间。
- 参数的长度不必相同,也不必事先指定。
- 在实际存储之前,任何参数都不会保留或使用存储空间。trie结构是在项目被引入内存时创建的。
- 一个函数可以用作另一个函数的参数,该函数可以用作下一个函数的参数。因此,例如,通过用参数“矩阵乘法”输入,人们可以检索在计算机上执行矩阵乘法的整个程序。
- 通过检查给定级别的存储,可以确定迄今为止存储了哪些相似的项目。例如,如果没有引用Egan, J. P.,那么只需要一两步就能找到Egan James的踪迹.......
刚刚描述的属性并不包括所有想要的属性,但是它们使计算机存储与人类操作者产生共鸣,并且他们倾向于通过命名或指向来指定事物。
5.4 语言问题
人类语言和计算机语言之间的基本差异可能是真正共生的最严重障碍。然而,令人欣慰的是,通过解释程序,特别是通过汇编或编译程序,如FORTRAN,已经取得了巨大进步,使计算机适应人类语言形式。Shaw,Newell,Simon和Ellis的“信息处理语言(Information Processing Language)”代表了另一种和解方式。而且,在ALGOL和相关系统中,人们通过采用可以轻易翻译成机器语言的表示和表达的标准公式来证明其灵活性。
然而,为了实现人与计算机之间的实时合作,有必要利用另外一种相当不同的通信和控制原理。可以通过比较通常针对智能人的指令和通常用于计算机的指令来突出这个想法。后者精确地指定了要采取的各个步骤以及采取这些步骤的顺序。前者提出或暗示了一些关于激励或动机的东西,它们提供了一个标准,在这个标准中,指令的执行者将知道完成任务的时间。简而言之:针对计算机的指令指定路线;针对人类的指令指定了目标。
人类似乎在目标方面比在路线方面更自然,更容易地思考。的确,他们通常知道一些关于旅行或工作路线的信息,但很少有人能从精确制定的行程开始。例如,谁会带着详细的路线说明从波士顿出发去洛杉矶?相反,用Wiener的话来说,前往洛杉矶的人试图不断减少他们还没有被烟雾笼罩的程度。
通过两种途径来实现计算机指令。第一个涉及解决问题、爬山算法、自组织项目。第二种是预编程段和闭合子程序的实时串联,操作员可以简单地通过名字来指定和调用这些子程序。
沿着第一条道路,已经有了有希望的探索性工作。很明显,在预定策略的宽松约束下工作,计算机将能够在适当的时候设计和简化自己的程序来实现既定的目标。迄今为止,这些成就并不重要;他们只是“原则上的示范”。然而,其影响深远。
尽管第二条道路更简单,显然能够更早实现,但它相对被忽视了。Fredkin的trie存储提供了一个有前途的范例。我们可能会在适当的时候看到一个认真努力来开发的计算机程序,这些程序可以像语言的单词和短语一样连接在一起,这样就可以进行任何计算或控制。显然,阻碍这种努力的考虑因素是,这种努力不会产生任何在现有计算机环境中具有重大价值的东西。在没有任何计算机能够对语言做出有意义的反应之前,开发语言是不可取的。
5.5输入输出设备
就人机共生的要求而言,似乎最不先进的数据处理部门是处理输入和输出设备的部门,或者从操作员的角度来看,是处理显示和控制的部门。在说了这句话之后,有必要做出符合条件的评论,因为用于高速引入和提取信息的设备工程一直很出色,而且一些非常复杂的显示和控制技术已经在林肯实验室等研究实验室中得到发展。然而,总的来说,在一般可用的计算机中,几乎没有比电动打字机更有效、更即时的人机通信。
显示器似乎比控制的状态好一些。许多计算机在示波器屏幕上绘制图形,少数计算机利用了字符显示管卓越的图形和符号功能。然而,据我所知,在技术讨论中,没有任何东西能接近铅笔和涂鸦板的灵活性和方便性,或者是人们使用的粉笔和黑板。
- 桌面显示和控制:当然,为了有效的人机交互,在相同的显示面上,人和电脑需要绘制图形和图画,并在相同的显示面上写注释和方程。这个人应该能够通过绘制图表,以粗糙但快速的方式向计算机展示一个功能。计算机应该阅读这个人的文字,也许是在清楚的大写字母的条件下,并且应该立即在每个手绘符号的位置张贴相应的字符,并将其翻译成精确的字体。有了这种输入输出设备,操作员将很快学会以机器可读的方式书写或打印。他可以编写指令和子程序,将它们设置成适当的格式,并在最终将它们引入计算机的主存储器之前检查它们。他甚至可以像Gilmore和Savell在林肯实验室所做的那样定义新的符号,并将它们直接呈现给计算机。他可以粗略地勾画出一张表格的格式,然后让电脑精确地塑造它。他可以修正计算机的数据,通过流程图指导机器,并且就像通常与其他工程师一样进行交互,除了“其他工程师”将是精确的绘图员,快速的计算器,助记符向导,以及许多其他有价值的合作伙伴。
- 计算机发布的墙面显示:在一些技术系统中,几个人共同负责控制行为相互影响的车辆。一些信息必须同时呈现给所有人,最好是在一个公共网格上,以协调他们的行动。其他信息仅与一两个操作者相关。如果所有信息都在一个显示器上呈现给所有人,那将只会产生无法解释的混乱。这些信息必须由计算机发布,因为手工绘图太慢,无法保持最新。
- 自动语音生成和识别:人类操作员和计算机之间的语音通信有多理想和可行?每当讨论复杂的数据处理系统时,都会问这个复杂的问题。与计算机一起工作和生活的工程师对这种愿望持保守态度。在自动语音识别领域有经验的工程师对可行性持保守态度。然而,人们仍然对与计算机对话的想法感兴趣。在很大程度上,这种兴趣源于人们认识到,很难把一名军事指挥官或公司总裁离开他们的工作,教他们打字。如果计算机能够被高层决策者直接使用,那么通过最自然的方式提供通信可能是值得的,即使花费相当大的成本。
刚才概述的问题现在甚至是一个关键问题,随着时间的推移,它似乎肯定会变得越来越关键。一些设计者相信,基于光阀原理,可以借助脉冲光源和分时观看屏幕来构建具有所需特性的显示器。
大多数思考过这个问题的人认为,大型显示器应该由单独的显示器控制单元来补充。后者将允许操作者修改墙面显示而不离开他们的位置。出于某些目的,希望操作者能够通过辅助显示器甚至墙面显示与计算机通信。至少有一种提供这种通信的方案似乎是可行的。
当然,大型墙面显示及其相关系统与计算机和一组人之间的共生合作相关。实验室实验一再表明,操作员非正式的平行安排,通过参考大型位置显示器来协调他们的活动,比更广泛使用的安排具有重要优势,它将操作员定位在各个控制台上,并试图通过计算机代理来关联他们的行动。这是需要仔细研究的几个操作团队问题之一。
对公司总裁的问题和时间尺度的初步分析表明,他只对作为爱好的计算机的共生关系感兴趣。业务情况通常进展缓慢,以至于有时间进行简报和会议。因此,对于计算机专家而言,与商务办公室中的计算机直接交互似乎是合理的。
另一方面,军事指挥官在短时间内做出关键决策的可能性更大。人们很容易夸大10分钟战争的概念,但是指望有十分钟以上的时间来做出关键决定是危险的。因此,随着军事系统地面环境和控制中心的能力和复杂性的增长,计算机自动语音生成和识别的真正需求似乎有可能得到发展。当然,如果设备已经被开发、可靠的和可用的,它就会被使用。
就可行性而言,与自动识别语音相比,语音产生带来的技术性问题不那么严重。一台商用电子数字电压表现在一个数字一个数字地大声读出它的指示。八年或十年,贝尔电话实验室,皇家理工学院(斯德哥尔摩),Signals Research and Development Establishment(Christchurch),耶鲁大学汉斯金实验室和麻省理工学院,Dunn,Fant,Lawrence,Cooper,Stevens和他们的同事,已经展示了一代又一代的可理解的自动发生器。汉斯金实验室的研究已经开发出了一种适合计算机使用的数字代码,这种代码使得自动语音完全可以理解相关的话语。
自动语音识别的可行性在很大程度上取决于要识别的单词的词汇量以及说话者和口音的多样性。几年前,在贝尔电话实验室和林肯实验室,人们已经证明了百分之九十八的正确识别自然的十进制数字。为了进一步扩大词汇量,我们可以说,现在几乎可以肯定地在现有知识的基础上开发出一种清晰发音的字母数字字符的自动识别器。由于未经训练的操作员读取的速度与训练有素的操作员键入的速度至少一样快,因此这种设备几乎可以在任何计算机安装中使用。
然而,为了在真正共生的水平上进行实时交互,可能需要大约2000个单词的词汇,例如1000个基本英语单词和1000个专业术语。这是一个具有挑战性的问题。在声学专家和语言学家的共识中,现在还不能完成建立2000个单词的识别器。然而,有几个组织乐意承诺在五年内为这样的词汇开发一个自动识别系统。他们会规定演讲要清晰,听写的风格,没有不寻常的口音。
尽管对自动语音识别技术的详细讨论超出了目前的范围,但值得注意的是,计算机在自动语音识别器的发展中起着主导作用。他们为当前的乐观情绪提供了动力,或者说是一些人目前的乐观情绪。两三年前,似乎在10年或15年内不会自动识别大量词汇;它将不得不等待语音交流中声学、语音、语言和心理过程的知识的逐渐积累。然而,现在,许多人看到了借助计算机处理语音信号来加速获取这种知识的前景,不少工作者认为,即使没有语音信号和过程的大量实质性知识的帮助,复杂的计算机程序也能像语音模式识别一样表现出色。将这两个考虑因素结合起来,可以将实现实际意义上的语音识别所需的时间估计降低到五年,即刚才提到的五年。
参考文献:
[1] A. Bernstein and M. deV. Roberts, "Computer versus chess-player," Scientific American, vol. 198, pp. 96-98; June, 1958.
[2] W. W. Bledsoe and I. Browning, "Pattern Recognition and Reading by Machine," presented at the Eastern Joint Computer Conf, Boston, Mass., December, 1959.
[3] F. S. Cooper, et al., "Some experiments on the perception of synthetic speech sounds," J. Acoust Soc. Amer., vol.24, pp.597-606; November, 1952.
[4] K. H. Davis, R. Biddulph, and S. Balashek, "Automatic recognition of spoken digits," in W. Jackson, Communication Theory, Butterworths Scientific Publications, London, Eng., pp. 433-441; 1953.
[5] G. P. Dinneen, "Programming pattern recognition," Proc. WJCC, pp. 94-100; March, 1955.
[6] H. K. Dunn, "The calculation of vowel resonances, and an electrical vocal tract," J. Acoust Soc. Amer., vol. 22, pp.740-753; November, 1950.
[7] G. Fant, "On the Acoustics of Speech," paper presented at the Third Internatl. Congress on Acoustics, Stuttgart, Ger.; September, 1959.
[8] B. G. Farley and W. A. Clark, "Simulation of self-organizing systems by digital computers." IRE Trans. on Information Theory, vol. IT-4, pp.76-84; September, 1954
[9] J. W. Forgie and C. D. Forgie, "Results obtained from a vowel recognition computer program," J. Acoust Soc. Amer., vol. 31, pp. 1480-1489; November, 1959
[10] E. Fredkin, "Trie memory," Communications of the ACM, Sept. 1960, pp. 490-499
[11] R. M. Friedberg, "A learning machine: Part I," IBM J. Res. & Dev., vol.2, pp.2-13; January, 1958.
[12] H. Gelernter, "Realization of a Geometry Theorem Proving Machine." Unesco, NS, ICIP, 1.6.6, Internatl. Conf. on Information Processing, Paris, France; June, 1959.
[13] P. C. Gilmore, "A Program for the Production of Proofs for Theorems Derivable Within the First Order Predicate Calculus from Axioms," Unesco, NS, ICIP, 1.6.14, Internatl. Conf. on Information Processing, Paris, France; June, 1959.
[14] J. T. Gilmore and R. E. Savell, "The Lincoln Writer," Lincoln Laboratory, M. I. T., Lexington, Mass., Rept. 51-8; October, 1959.
[15] W. Lawrence, et al., "Methods and Purposes of Speech Synthesis," Signals Res. and Dev. Estab., Ministry of Supply, Christchurch, Hants, England, Rept. 56/1457; March, 1956.
[16] A. M. Liberman, F. Ingemann, L. Lisker, P. Delattre, and F. S. Cooper, "Minimal rules for synthesizing speech," J. Acoust Soc. Amer., vol. 31, pp. 1490-1499; November, 1959.
[17] A. Newell, "The chess machine: an example of dealing with a complex task by adaptation," Proc. WJCC, pp. 101-108; March, 1955.
[18] A. Newell and J. C. Shaw, "Programming the logic theory machine." Proc. WJCC, pp. 230-240; March, 1957.
[19] A. Newell, J. C. Shaw, and H. A. Simon, "Chess-playing programs and the problem of complexity," IBM J. Res & Dev., vol.2, pp. 320-33.5; October, 1958.
[20] A. Newell, H. A. Simon, and J. C. Shaw, "Report on a general problem-solving program," Unesco, NS, ICIP, 1.6.8, Internatl. Conf. on Information Processing, Paris, France; June, 1959.
[21] J. D. North, "The rational behavior of mechanically extended man", Boulton Paul Aircraft Ltd., Wolverhampton, Eng.; September, 1954.
[22] 0. G. Selfridge, "Pandemonium, a paradigm for learning," Proc. Symp. Mechanisation of Thought Processes, Natl. Physical Lab., Teddington, Eng.; November, 1958.
[23] C. E. Shannon, "Programming a computer for playing chess," Phil. Mag., vol.41, pp.256-75; March, 1950.
[24] J. C. Shaw, A. Newell, H. A. Simon, and T. O. Ellis, "A command structure for complex information processing," Proc. WJCC, pp. 119-128; May, 1958.
[25] H. Sherman, "A Quasi-Topological Method for Recognition of Line Patterns," Unesco, NS, ICIP, H.L.5, Internatl. Conf. on Information Processing, Paris, France; June, 1959
[26] K. N. Stevens, S. Kasowski, and C. G. Fant, "Electric analog of the vocal tract," J. Acoust. Soc. Amer., vol. 25, pp. 734-742; July, 1953.
[27] Webster's New International Dictionary, 2nd e., G. and C. Merriam Co., Springfield, Mass., p. 2555; 1958.
MENU
- J.C.R. Licklider 小传
- Licklider 人生经历
- Licklider 的工作成就
- 心理声学
- 半自动地面防空系统
- 信息技术
- 人机共生
- Project MAC
- 全球计算网络
- Licklider的理念:人机共生(Man-Computer Symbiosis)
- 摘要
- 1.介绍
- 1.1共生
- 1.2在“机器增强的人类”和“人工智能”之间
- 2.人机共生的目标
- 3.计算机参与公式化和实时思维的需要
- 3.1技术思维的初步和非正式工效分析
- 4.预期共生关系中人和计算机的可分离功能
- 5.实现人机共生的前提条件
- 5.1 人与计算机之间的速度不匹配
- 5.2 存储器硬件要求
- 5.3存储组织要求
- 5.4 语言问题
- 5.5输入输出设备
- MENU