| 雷峰网
0
1955年8月31日,“人工智能”这个词首次出现在一个持续2个月、只有10个人参加的研讨会提案上。提案撰写者包括John McCarthy (Dartmouth College), Marvin Minsky (Harvard University), Nathaniel Rochester (IBM), 和 Claude Shannon (Bell Telephone Laboratories)等人。在这一年之后的达特茅斯夏季研讨会(1956)则被广泛认为是人工智能研究的诞生之日。
而就在这份提案中给出了对于“人工智能”的定义:
尝试找到如何让机器使用语言、形成抽象和概念、解决现在人类还不能解决的问题、提升自己等等。对于当下的人工智能来说首要问题是让机器像人类一样能够表现出智能。
以及自己希望的结果:
“我们认为, 如果一组优秀的科学家在一起工作一个暑假的话,能够在这些问题(一个或多个)中取得一个重大进展”。
这一大会提案提出了在人工智能方向上的研究与思考方向,经过将近一年的酝酿,在1956年的达特茅斯会议上的讨论引起了计算机学界的关注和共鸣,从而宣布了“人工智能”这一新兴学科的诞生。对于这份对人工智能发展有着指导性意义的大会提案,雷锋网编译如下:
J.麦卡锡,达特茅斯学院
M. L.明斯基,哈佛大学
N.罗切斯特,I.B.M.公司
C.E。香农,贝尔电话实验室
1955.8.31.
我们提议明年(1956年)暑假期间在新罕布什尔州汉诺威的达特茅斯学院进行一次为期2个月、10人参加的人工智能研讨会。我们的研究建立在这样的一种猜想之上,即(人类的)学习的每一方面或者智能的任意一种特征在原则上都能够被精确描述,并可以由机器可以用来模拟学习和智能,我们的研究是建立在这一猜想的基础之上。我们将试图找到如何让机器使用语言、形成抽象和概念、解决现在人类还不能解决的问题、提升自己等等。我们认为, 如果一组优秀的科学家在一起工作一个暑假的话,能够在这些问题(一个或多个)中取得一个重大进展。
以下是我们对人工智能方面思考的一些问题:
1.自动化计算机
倘若一台机器可以工作,那么可以对一台自动化计算机进行编程,用来模拟机器工作。现有计算机的运行速度与内存容量可能不能够支持模拟人类大脑的众多高级功能,但是,主要的瓶颈不在于机器容量小,而在于我们不能够尽自己所能编写出足以支持计算机来模拟人类大脑高级功能的强大程序。
2. 如何编程,以使计算机具备使用语言的能力?
据猜测,人类的大部分思想是由通过推理与想象来使用词汇获得的。根据这一观点,可以得出以下结论:人类的语言推理归纳能力是通过允许一个新词汇和包含该词汇的一些句子所暗含的一些语言规则,或其他句子所暗含的一些语言规则,进入心理词汇库中形成获得的。不过,从未有人对该观点作过精确阐释,也未列举出相关语言应用实例。
3. 神经元网络
如何设计排布一组(假定的)神经元,使这些神经元能够生成概念?关于该问题Uttley, Rashevsky与其团队,Farley and Clark, Pitts and McCulloch, Minsky, Rochester and Holland等研究者曾做出大量理论研究和实验研究。曾获得了部分研究成果,但是,为了解决该问题仍需大量理论研究工作的支持。
4.计算规模理论
假定我们要解决一个非常棒的问题(需要严格测试一个富有建议性的答案是否有效),一种解决方案是一次测试所有的答案。这种方案效率低,但是,为了排除该解决方案,我们需要制定出一些关于高效计算方法的标准。我们曾考虑到,为了衡量一种计算方法的效率,有必要制定出一套用来衡量计算设备复杂性的方法,要制定出这样一套方法,需要提出一个关于功能复杂性的理论。Shannon与McCarthy就该问题开展研究,并获得了部分成果。
5.自我提升
一台真正意义上的智能机器可能会执行一些活动,这些活动在很大程度上可以成为自我提升,为了实现该目的,已经有人提出了一些方案,并值得作进一步研究。该问题也可以作抽象层面的研究。
6.抽象概念
大量的“抽象概念”类型可以得到清楚地定义,也存在一些“抽象概念”类型难以明白无误地定义。值得直接尝试划分这些“抽象概念”类型,并描述从感观数据或其他数据来源获取抽象概念的机器方法。
7. 随机性与创造性
针对创造性思维与缺乏想象力的有主观决定权的思维之间的差异,我们有一个非常诱人的,但不甚完善的构想,即两者之间的差异在于随机性。这种随机性伴随直觉产生,并具有效率。换言之,一般来讲,受到限制的随机性是有序思考的产物,但是,经过思考的猜想或预感反而包括这种随机性。
除了上述由我们共同提出的供研究的问题,我们也邀请参加该项目的个体成员来陈述他们各自的研究侧重点。该项目的四位发起者的演讲见附录。
本次大会提议的发起者如下:C. E. Shannon,M. L. Minsky, N. Rochester, J. McCarthy。洛克菲勒基金会为本项目提供了相关费用支持。
我希望自己今后的研究专注于以下列举的一个或两个研究论题。
1. 将信息理论概念应用到计算机器与大脑模型中。信息理论存在的一个主要问题是通过一个噪音渠道可靠传播信息。计算机器存在一个相似的问题,即运用不可靠的元素进行可靠地计算。关于该问题,von Neumann, Shannon 与Moore曾做出过研究,但是,仍然存在一些开放性问题亟待解决。关于几种元素,与渠道容量相似的概念发展问,所要求冗余的上下限深刻分析等问题都被列为重要问题。另一个问题与信息网络理论有关,在该网络中信息在许多闭合圈内流通(这种信息流通方式与通讯理论通常所主张的简易单一渠道信息流通方式形成对比)。在闭合圈中,信息流通延迟问题成为重要研究对象,有必要提出一个全新的途径。当一个信息集合的部分过去信息为已知时,这将涉及到局部熵等概念问题。
2.与机器人相匹配的环境-大脑模型。通常一台机器或动物只能在有限的环境里运转或只能适应有限的环境。即便是复杂的人类大脑最初也是先适应其存在环境的一些简单特征,逐渐适应其他复杂的环境特征。我提议,通过研究一系列相匹配(理论层面上)的环境和与之相适应的大脑模型两者的并行发展,进而综合研究大脑模型。研究的重点是对该环境模型进行分类,并用数学结构来表示该模型。通常在讨论机械化智能时,我们会联想到能够进行诸如证明某些原理,创作音乐,或下棋等高级人类思维活动的机器。在此,我提议,从简单的环境模型入手,当环境变得有利(只是无关紧要)或不那么复杂时,从一系列简易模型开始研究,慢慢朝向那些高级活动的研究迈进。
要设计出具备以下学习能力的机器并非难事。为机器配备输入与输出渠道,及一种为输入信息提供各种输出反应的内部方法,如此,机器能够通过试错法得到训练,并获得一连串的输入与输出函数。像这样一台机器,倘若放置在一个合适的环境里,并给定一套“成功”或“失败”的衡量标准,经过训练能够展示出一套“目标探索”行为模式。这样一台机器智能够在一种复杂的环境里缓慢发展,通常情况下,也不会具备高级行为模式,除非提供给这样一台机器,或机器本身能够发展,抽象感官资料。
如今,判断成功的标准不应当局限于在机器的输出渠道中产出如设计者期盼的特定活动模式,而应当包括在一个特定的环境中展示出一种特定操作的性能。在某种程度上,动力机的情况呈现一种两分式感官情形,当机器具备将其输出活动与环境变化相关联的“动力机抽象”集合整合在一起的能力时,便可以快速取得成功。
在一段时间内,我已经对这类系统作出相关研究,认为,如果设计出的机器的感官抽象与动力机抽象满足某些关系,这台机器将具备展示更高一级行为模式的能力。如果相对应的动力机行为真实发生的话,这些关系涉及到配对,动力机抽象与感官抽象,将形成代表预设的环境变化的新型感官情形。
所探寻的重要结果为:根据所处的环境特征,机器自身能够建立一个抽象的环境模型。倘若遇到困难,机器首先从内部抽象的环境模型中搜寻答案,然后才尝试外部实验。鉴于这些初始的内部研究,外部实验将变得更为灵活,机器所展示出的行为模式将被视为极具“想象力”。
在我的论文中,将尝试对机器如何模拟人类行为模式进行探究,也将朝该研究方向进一步努力。我希望,到1956年夏,我能够设计出这样一台十分接近计算机编程阶段的智能机器。
机器性能的原创性
在为一台自动化计算机编程的过程中,一般来讲,我们应当为机器设定一系列准则,以应对操作过程的任何突发事件。我们期望,机器能够在极大程度上遵循所设定的准则,展示出非原创性或常识。此外,当机器操作出现紊乱情形时,设计者也会感到厌烦,因为他为机器设置的原则本身存在些许矛盾。最后,在为机器编程过程中,设计者在处理所遇到问题时,往往会非常吃力,但是,当机器具备一点点直觉或能够进行合理性推理时,机器自身能够直接找到问题所在。本文描述的构想如下:如何使机器能够在上述提出的广泛领域中展示出更为复杂高端的行为模式。文章讨论的问题我在这五年内也或多或少地涉猎过,我希望在明年夏天的人工智能项目中该方面的研究能够有所进展。
生活在我们的文化环境中使得我们能够解决很多问题。关于上述所描述的程序具体如何进行仍然不太明晰,但是我将依照Craik提出的模型对于该问题的这一方面进行讨论。Craik建议,心理作用主要是通过在大脑中构建小型引擎形成的,这些引擎能够模拟并预测与环境相关的抽象概念。因而,该问题的解决方法可以列举如下:
1. 环境能够提供数据,基于所提供的数据形成某些抽象概念。
2. 这些抽象概念与某些内在习惯或动力提供了:
3.1 就未来期望实现的环境,提供问题的定义,即设定一个目标。
3.2 解决该问题的一个建议性行动方案。
3.3 刺激大脑中与该情形相匹配的引擎。
4. 然后,该引擎将预测该环境特征和所提出的行动方案将导致什么结果。
5. 如果预测结果与目标相符,个体将继续依照所指示的方案行动。
目前,针对这种问题最实用的机器解决方案是对蒙特卡洛方法的拓展。通常能够用蒙特卡洛方法解决的问题,总是存在被误解的情形,其中存在多种可能性因素,在获得分析方案的过程中,我们不能够确定忽略哪些因素。因此,数学家使用机器进行数千项随机实验,实验结果关于答案提供了大致猜想。对蒙特卡洛方法的拓展正是运用这些结果作为引导,以确定忽略哪些因素,来简化问题,获得近似的分析型方案。
有人可能会问到,为什么这种方法也含有随机性。因为,对于机器来讲,需要运用随机性来克服编程人员的考虑不够周全的地方,克服其偏见。尽管这种方法是否有必要包含随机性尚未得到证实,当前已经由大量证据支持其存在的必要性。
为一台自动化计算机编程使之能够具有原创性,引进随机性却不运用瞄准器是不可行的。例如,当设计者编出一种程序,使得计算机每一万步生成一个随机数据,并将其当作一项指令进行操作,结果将出现混乱。当出现大量混乱后,机器可能将会尝试一些禁止的指令或者执行停止指令,这样的话,实验将中止。
然而,针对上述问题,存在两种合理的途径。其一,发现大脑是如何成功处理操作指令混乱的,复制大脑的功能。其二,运用一些要求找到原创性答案的实例问题,尝试在自动化计算机上编程,以解决这些问题。两种方法中任意一种都可能取得成功。但是,尚未能够确定这两种方法,哪一个更快速,用时更短。我在该研究领域的工作主要侧重于前一种方法,因为我认为,为了解决这个难题,最好是能够掌握所有相关科学知识,我已经意识到这些计算机的当前状态,并体会到为机器编程的艺术魅力。
大脑的控制机制明显有别于如今的计算机控制机制。其差异性之一表现在失败的方式。一台计算机的失败主要表现在输出不合理的结果。存储误差或数据传输错误在很大程度上超出数据层面。控制误差将会导致出现任何结果,可能执行错误的指令或操作错误的输入-输出单元。另一方面,人类语言的错误可能会产生仍然有逻辑,讲得通的语言输出结果。可能大脑机制是这样的,推理的少许误差将会使得产生的随机性朝向合理正确的方向发展。也许控制行为顺序的机制能够引导这种随机因素,最终在完全随机的条件下提高想象过程的有效性。
有一些研究已经致力于在我们的自动化计算机上模拟神经元网络。本研究的重点是使机器能够形成并操作概念,具备抽象、概括及命名的能力。已经就大脑机制做出研究,实验的第一阶段主要修正该理论的某些细节,第二阶段正在进行中。预计到明年夏天,本研究将顺利完成,并完成最终实验报告。现在预测明年夏天我的实验将进行到哪一阶段还为时尚早,但是,我在论文中将坚持探寻的主要研究问题为:“如何设计出一台机器,保证其在解决问题过程中展现出原创性?”
在明年夏天将要召开的人工智能研讨会上,我提议研究语言与智能两者之间的关系。很明显,直接将试错法运用到处理感官数据与动力机活动两者的关系中,不会有助于机器学会更为复杂的行为模式。相反,有必要将试错法运用到更为抽象的层面上。显然,人类大脑将语言用作处理复杂现象的手段。更高水平的试错法通常以形成构想,并验证构想的形式呈现。英语语言拥有的大量语言特征是目前所描述的每一种官方语言所缺乏的。
1. 可以精确描述英语中经由非正式数学补充表达的幅角。
2. 英语应用范围的广泛性使得这种语言能够吸收并合理利用其他任何一种语言。
3. 英语语言使用者能够用英语来指代自己,并根据自己解决研究过程中的所遇到问题的进展,重新修正自己的陈述方式。
4. 除了证明规则,英语,倘若在数学中得到完全表达,能够形成猜测式规则。
目前制定的逻辑语言已经形成指令列表,允许计算机进行超前计算,或者形成数学中的部分公式表达法。后者已经被构建,以便于:
1. 用非正式数学表达方式进行简单的描述。
2. 允许将陈述表达从非正式数学表达法翻译为语言。
3. 讨论某证明过程。
目前,尚未有人尝试将人工语言中的证明过程变得与非正式数学中的证明过程一样简短。因而,构建一种能够用计算机编程的人工语言来解决需要猜想与自我推理的问题是值得尝试的。这种人工语言应当与英语保持一致,即关于特定主题简短的英语陈述应当对应人工语言中简短的陈述方式,故英语中简短的观点应当对应人工语言中简短的猜测性观点。我希望能够制定出一种具备这些特征的人工语言,并且包括实物,事件等概念,也希望运用这种人工语言,使为机器编程,以便机器能够像人类一样玩游戏,并完成其他任务成为可能。
以下是将参加明年的达特茅斯研讨会的人员以及对此研究课题感兴趣的人员名单:
后记:
在2006年7月12-15号,达特茅斯人工智能会议(Dartmouth Artificial Intelligence Conference)召开,本次大会的主题为“下一个五十年(AI@50)”,并以此纪念这次“达特茅斯会议(Dartmouth Conference)”五十周年。十位最初参与的科学家中有五位也出席了会议,他们是:Marvin Minsky, Ray Solomonoff, Oliver Selfridge, Trenchard More, and John McCarthy。大会主席James Moor在AI杂志发表的总结报告中提及:
“想要对任何进展找出它的开始日期是困难的,但是1956年的达特茅斯夏季研究项目经常被认为是将AI作为一个研究领域的开端。John McCarthy,当时是达特茅斯的一名数学教授,他对于自己和Claude Shannon合作的论文(发表在Automata Studies上)感到失望,因为其没有更多地提到计算机在获取智能上更多的可能性。因此,在John McCarthy, Marvin Minsky, Claude Shannon和 Nathaniel Rochester为1956年研讨会写的提案中,McCarthy 想要进一步明确这个概念,他也被认为是“人工智能”这个词的创造者,为这个领域的研究打好了方向。设想下,如果当时采用“计算智能”或者其他任何一种可能的词,现在人工智能领域的研究会不会有所不同?”
1956年的原始项目中的五位科学家参与了AI@50,他们都回忆了那段往事。
McCarthy认为1956年的项目并没有达到初始的合作预期。参会者没有同时抵达,并且基本还是维持在他们自己的研究日程中。但是McCarthy强调在项目期间还是有许多重大的研究进展,特别是Allen Newell, Cliff Shaw,和 Herbert Simon的信息处理语言(IPL),以及逻辑理论机器;
Marvin Minsky提到,虽然他在1956项目之前几年就将神经网络作为自己的学位论文来进行研究,但是他中断了这个工作因为他确信使用计算机的其他方式能够在这方面取得进步。Minsky也提到当下太多AI研究只是想做那些最流行的东西,也只发表哪些成功的结果。他认为AI之所以能成为科学是因为之前的学者不仅发表那些成功的结果,也发表那些失败了的;
Oliver Selfridge特别提到那些相关领域的研究(不管在1956夏季项目之前还是之后)都为推动AI成为一个研究领域做出了重要的贡献。改进语言和机器的发展都是其本质原因。他提出对许多早期先驱科学家进行致敬,像开发了分时理论的J. C. R. Licklider,设计了IBM计算机的Nat Rochester,以及一直致力于感知器研究的Frank Rosenblatt;
Trenchard More被罗切斯特大学(University of Rochester)派到暑期项目中两个星期。一些有关AI项目最好的笔记是由他所记录,虽然讽刺的是他承认自己从来都不喜欢“人工”或者“智能”来作为这个研究领域的名称;
Ray Solomonoff说他之所以去这个暑期项目是希望能说服大家有关机器学习的重要性。他在项目期间了解到大量有关图灵机的事情,影响了他未来的工作。
因而,1956年的夏季研究项目在某些方面不甚令人满意。研究项目的参与者到来的时间各不相同,各顾各致力于自己的项目,因而,这个研究项目不能称得上是普通意义上的会议。该研究领域在基本理论层面没有达到一致见解,特别是在关于学习的基本理论方面缺少统一定义。AI研究领域的发展并不是建立在方法,问题选择或普通理论的一致性上,而是研究者之间拥有共同的愿景——可以是计算机执行智能任务。在1956年大会的提案中,该愿景被加粗描述:“我们的研究建立在这样的一种猜想之上,即(人类的)学习的每一方面或者智能的任意一种特征在原则上都能够被精确描述,并可以由机器可以用来模拟学习和智能,我们的研究是建立在这一猜想的基础之上”。
尽管在过去的50年间,AI研究领域取得了多方面的成功,在该领域中仍存在无数明显的分歧。经常出现不同的研究领域不愿意合作,研究者使用不同的研究方法,仍然缺少关于智能或学习统一的基本理论,使得该领域的研究能够保持一致性,实现同步发展。(编者按:在近十年来情况有所变化,以深度学习为代表的方法成为了人工智能的主流方向。尽管如此,学界仍在期待其他的理论在人工智能领域方面的突破,不可否认的是,1956年的达特茅斯会议正是人工智能领域最重要的历史性里程碑之一,并仍然在指导着人工智能未来研究的方向。)
本文由雷锋网编译,未经允许拒绝转载!
雷峰网原创文章,未经授权禁止转载。详情见转载须知。