推理
十几年以前,我曾问过著名的记忆力研究者戈登·鲍尔有关思维的一些问题,我被他暴跳如雷的回答吓了一跳:“我完全不做‘思维’的工作。我不知道‘思维’是什么。”斯坦福大学心理学系的主任完全不做思维的工作,甚至一点也不了解它,这怎么可能?接着,鲍尔很不情愿地说:“我想,你可能是指对推理的研究。”
思维在传统上一直是心理学中的一个中心议题,可是,到70年代,认知心理学中知识的爆发使这个词变得不那么称手了,因为它包括一些彼此相隔很远的过程,比如暂时的短期记忆和长时期的问题求解。心理学家们喜欢以更具体的一些词汇谈及思维过程:“极度规范化”、“程序分块”、‘检索”、“范畴化”、“正式操作”及其它十几种说法。“思维”现在已经慢慢变成了一个比以前狭窄得多,也准确得多的意义:即对知识的操纵,以实现一个目标。可是,为避免任何误解,许多心理学家,比如,鲍尔,情愿使用“推理”个词。
尽管人类一直总是把推理能力看作是人性的本质所在,可是,对推理的研究长期以来一直是一团死水。从30年代到50年代,除了卡尔·登克尔和其它一些格式塔学者进行的问题求解实验,以及皮亚杰和追随者们进行的不同知识发展阶段儿童思维过程的特征研究以外,很少有人进行推理的研究。
可是,随着认知革命的到来,对推理的研究变成了一个活跃的领域。信息处理模式使心理学家可以提出一些假设,可以用流程图的形式推论在不同推理过程中发生的一些事情。而计算机又是一件很好的机器,从此以后可以用它来测验一些假设。
信息处理学说和计算机是互为协作的。一种有关任何推理形式的假说都可以用信息处理的术语描述出来,把它们看作是信息处理的具体步骤。计算机然后就可以进行编程,以执行一种类比的步骤顺序。如果这个假设是正确的,机器就可以得出与人类推理思维相同的结果。同样,如果一个给一台计算机编写的推理程序得出人类对同一个问题相同的结论,则人们就可以假设,这个程序所运行的方式与人脑推理的方式是一样的,或者至少在以类似的方式在推理。
一台计算机是如何进行这样的推理工作的?它的程序包含一个日常的程序,或者是一组指令,再加上一系列子程序,每一道程序都使用或者不使用,这取决于前一个运行的结果和程序存储器里面的信息。一种常见的程序是一系列如果-则步骤:“如果输入符合条件1,则采取行动1;如果不符合,则采取行动2。比较条件2和结果,如果结果[大于]小于或者其它任何情况,则采取行动3。否则采取行动4……存储所得的条件2,3……然后,根据进一步的结果,以这样或者那样的方式使用这些存储起来的项目。”
可是,当计算机执行这些程序时,不管是在数学计算或者是在问题求解中,它们真的是在推理吗?它们难道不是在像自动机一样毫不动脑筋地执行事先规定的行动步骤?这个问题留给哲学家比较好。如果计算机能够像可获得知识的人类一样证明一项公理,开始一台空中航行器,或者确定一首诗是否为莎士比亚所创作,谁又能够说,它就是一种没有思维的自动机,或者人类又不是这样一种自动机呢?
在1950年,当时还只有几台非常原始的计算机存在,但计算的理论却在一些数学家、信息理论家和其它一些人中进行着激烈的讨论。艾伦·特林是一位有天赋的英国数学家,他提出了一种测试法,这种方法更具哲学意味,少一些科学性,它是要测试一台计算机是否可以思想。在测试中,一台编程解决某些问题的计算机放在一个房间里,很熟悉这类问题的一个人站在另一个房间里,第三个房间里有一位裁判,他通过电报方式可以与其它两间房通话。如果裁判可以从对话中看出哪一个是计算机,哪一个是人,计算机就通过测试了:它可以思想。特林测试的有效性值得商榷,可是,至少,它可以证明,如果一台计算机好像能够思想,它所做的事情就算跟思维差不多了。
(到目前为止,还没有一台计算机能够通过特林测试。1991年11月,在波士顿计算机博物馆进行了一次特林测试。10位从大街上挑选来代表那个人的裁判,在键盘上敲出问题和说明,然后从屏幕上看到一些答案,这些答案来自好几种计算机程序中的任何一种,或者是一些看不见的人做的。最后赢得了准入的一个程序是一种商用程序,名叫PC治疗专家第三代。这里,我们从1991年11月9日的《纽约时报》第一版上摘录一些问题和答案:
PC治疗专家第三代:也许您在这种伙伴关系中没有得到另一方足够多的关心。
裁判:为了防止冲突或者问题出现,在这些关系中哪些是最为重要的关键因素?
PC:我认为您没有按我的思路考虑问题。
裁判:这哪里算是对问题的答案?下个问题:你认为男女私情是不现实的吗?是否从一开始就注定要失败?
PC:我倒宁愿闭着眼睛过日于。
裁判:你在男女私情中碰到过问题吗?
PC:我总是想法让自己逗人喜欢。
任何把这样一些牛头不对马嘴的回答看作是人类回答的裁判,他一定是对人类的对话能力有一种奇怪的理解。)
到60年代,大多数认知心理学家,不管他们是不是同意计算机真的会思维,都认为计算理论是一种概念上的突破;它使他们第一次能够以详细和准确的信息处理术语描述认知的任何方面,特别是推理。再说,已经提出有关任何此类程序的步骤的假设以后,他们可以把它们从单词翻译成计算机语言,并在计算机上进行测试。如果结果是成功的运行,则它意味着思维的确是通过某种类似这个程序的方式在推理。因此,毫不奇怪,赫伯特·西蒙说计算机是对心理学的重要程度不亚于显微镜对生物学的重要程度。也不奇怪,其它一些狂热者说,人类思维和计算机是“信息处理系统”这个种属的两个物种。
求解能力是人类推理中最为重要的应用。大多数动物都是通过天生或者部分天生的行为模式进行象寻找食物、逃避天敌和筑巢等的活动。人类解决或者试图解决大部分问题的办法,是通过学习或者创造性的推理进行的。
50年代中期,当西蒙和纽厄尔着手创立“逻辑理论器”这第一道刺激了思想的程序时,他们向自己提出了一个问题:人类是怎样解决问题的?逻辑理论器花了他们一年的时间,可这个问题却占了他们15年的时间。最后的学说发表在1972年,它已经成了这个领域从今以后的工作基础。
他们主要的工作方法,按照西蒙的自传,就是两个人的集体讨论。这涉及归纳和演绎推理,类比和比喻性的思维以及想象的驰骋——简单地说,任何种类的推理,不管是合理的还是不合理的:
从1955年到60年代早期,当时,我们每天见面……[我们」主要是通过对话来进行工作的。艾伦可能比我说得还多些。现在的情形肯定如此。我认为事情一向就是这样的。可是,我们谈话是有一定之规的,即,一个人可以瞎谈一通,可以没有道理,也可以模模糊糊,可是不准批评,除非你准备说得更准确一些,更有道理一些。我们谈的一些东西有些是有一定道理的,有些只有少许道理,有些纯粹是胡扯,就这样乱谈一气,然后听着,一次又一次地谈。
他们还进行了一系列实验室工作。不管是一个人做还是一起做,他们都会记录并分析一些步骤,把他们或者别人解决难题的步骤写下来,然后把这些步骤当作程序写下来。有一个很喜欢的难题,他们一直用了好些年,就是一个孩子的不动玩具,名叫“汉诺依之塔”。如果说最简单的,它是由三块不同大小的圆片组成的(中间都有孔),平底座上有三根坚杆,圆片就堆在这三根杆的其中一根上。一开始,最大的圆片在最下面,中等大的圆片在中间,最小的一个在顶层。问题是要以最少的步骤一次移动一个,不准把任何圆片放在另一个比它小的圆片上,直到它们都以同样的顺序堆在另一根竖杆上。
完美的解只需要7步,不过,由于移错了步骤就会引起死解,因而得退回去重来,这就需要好多步骤。在更先进的版本中,这种解需要复杂的策略和许多步骤。一种由5个圆片组成的游戏需要31个步骤,7个圆片组成的游戏需要127步,等等。西蒙曾很严肃地说过,“汉诺依之塔对认知科学的重要性不亚于果蝇对现代基因学的意义——它是一种无法估量其价值的标准研究环境”。(可是,有时候,他又把这项荣誉归结给了国际象棋。)
这个小组使用的另一项实验工具是密码算术,在这种难题中,一道简单的加法题中的数字换成了字母。目的是要找出这些字母代表哪些数字。下面是西蒙和纽厄尔简单一些的例子:
S E N D(送)
M O R E(多)
———————————
M O N E Y(钱)
第一步很明显:M必定是1,因为任何两位数——这里指S+M——都不可能加起来大于19,哪怕有进位。西蒙和纽厄尔让志愿者一边解题一边大声念,把他们所说的一切话都记下来,之后把他们的这些思想过程的步骤编进图中,表现成一个步骤的寻找轨迹、不止一个选择时交叉点的决定,走向死解的一些错误选择,从最后一个交叉处回过头来重试另一个办法等等。
西蒙和纽厄尔特别利用了国际象棋,这是一种比汉诺依塔或者密码算术难得多的复杂问题。在一种60步骤的典型国际象棋比赛中,每一个步骤平均都有30种可能步骤;只先“看”三步就意味着要看到27000个可能性。西蒙和纽厄尔希望了解的问题是,象棋手是怎样处理数字如此庞大的可能性的。答案是:有经验的象棋手并不考虑他自己下一步可能要走,或者对手可能要走的所有的可能步骤,而只是考虑几步有意义,并符合基本常理的一些棋路,如“保护国王”,“不要因为很低的价值而随便弃子”等。简短地说,象棋手进行启发式的寻找——一种由宽广的、符合棋理的战略原则引导的寻找——而不是整体但没有条理的瞎找。
纽厄尔和西蒙问题求解学说又花费了他们15年的时间,因为字母顺序的原因,纽厄尔的名字在他们的共同出版物上总是处在前面。他们的学说是,问题求解是对一种通道的追寻,从开始状态直到目标。为了实现这个目标,求解者必须通过由他可能到达的所有可能状态构成的问题空间,并通过所有符合通道限制(规则或域的条件)的步骤找到一个通道。
在这样的一些寻求中,可能性通常会呈几何级增长,因为每一个决定点都会提供两种或者两种以上的可能性,可能性下面又有若干决定点,因此而提供另一套可能性。在普通的国际象棋比赛的60个步骤中,如前面已经说过的,每一个步骤平均都有30种可能性;一场比赛中通道的总数为30的60次方到3000万个百万立方百万立方百万立方百万立方百百万立方百万立方——这个数字完全超出了人类的理解力。相应地,如西蒙和纽厄尔的研究所演示的,问题求解者在他们的问题空间里寻找他们的通道时,并不会寻找每一个可能的通道。
他们于1972年出版,并相应地称作《人类问题求解》的卷秩浩繁的著作中,纽厄尔和西蒙把他们认为是总体特征的东西提出来了。其中有:
——因为短期记忆的局限,我们是以串行的方式在问题空间中搜寻的,一次解决一个问题。
——可是,我们并不去执行对每一个可能性一个一个的串行搜寻。我们只在有很多种可能性的时候才使用这种方法。(比如,如果你不知道一小串钥匙中的哪一个可以打开朋友家的门,你只好一次试一把。)
——在许多问题求解情形里,试误法是不可行的,这样,我们就只好进行启发式的搜寻。知识使这一点变得非常有效。解决象由八个字母构成的颠倒字母构成的字这样一个简单问题,比如SPLOMBER,可能需要56个工作日,如果你把全部40,320个排列以每5秒钟一个写下来的话,可是,大多数人可以在几秒或者几分钟内解决这个问题,因为他们排除掉了无效的组合(比如,PB或者PM)而只考虑有效的组合(SL,PR,等)。
——一个常用的、重要的启发式简化法是纽厄尔和西蒙称作“最好从头开始”的方法。在搜寻通道的任何交叉点或者“决定树叉”上,我们必须先试有可能会把我们带到离目标最近的地方的那一个。每一步都试着靠近目标是非常有效的(尽管有时候我们得离开它,以便绕过一个障碍物。)
——另一种补充性的,更为重要的启发是“中值末尾分析法,”西蒙称这种方法为“GPS(总体问题求解法)的马力”。中值末尾分析法是一种前进和后退混合起来的分析法。跟只寻求前进步骤的象棋不一样,在许多情况下,问题求解者知道,他不能够直接进入目标,而只能退而求其次,先接近子目标,再从于目标接近大目标,或许,他还得退回到更早以前的子目标,或者更早更早一些的子目标。
最近回顾问题求解学说时,基思·霍利约克提供了中值末尾分析法的一个很差的例子。你的目标是要将客厅重新喷漆。最近的子目标是你可以进行喷漆操作的条件,但这要求你拥有漆和刷子,因此,你必须先到达购买这些用品的子目标。要这样做的话,你又必须先实现到达五金商店这样一个子目标。这样一直退下去,直到你完全策划好了从目前的状态到拥有一间喷了漆的客厅为止。
像纽厄尔和西蒙求解学说这样一种成就虽然了不起,可它只使用了演绎推理。再说,它只考虑到了“知识贫乏”问题求解:只应用于迷宫、游戏和抽象问题。这种方法描述知识丰富领域里的问题求解,比如科学、商业或者法律等如何,还不太清楚。
因此,在过去的二十多年时间里,一系列研究者已经把推理的调查拓宽了。有些人研究了演绎和归纳推理以之为基础的一些心理倾向;有些人研究了两种形式的推理,还有一些人研究了我们在日常推理中的情况。有些人研究过专家和新手在知识丰富领域里进行的推理差别。这些调查已经结出了丰硕的成果,给人类思维推理这片看不见的工作领域闪进了光芒。这里是一些典型例子:
演绎推理:上溯至亚里士多德时代的传统观念认为,一共有两种推理形式,演绎和归纳。演绎是从已经给定的信条中抽出进一步的信条,也就是说,如果前提是正确的,结论也应该是正确的,因为结论必然包含在前提之中。从亚里士多德经典的三段论的前提中:
所有人都有生有死。
苏格拉底是个人。
我们必然得出:
苏格拉底有生有死。
这种推理非常严密,强烈,也很容易理解,很有说服力。它得到了逻辑和几何公理的证明。
可是,许多只有两个前提,也只包含三个段的三段论却不是如此明显的;有些很难理解,大多数人都无法从中得出一个有效的结论。菲利普·约翰逊-莱尔德曾研究过演绎心理学,他举出了一个曾在实验室里使用过的例子。想象一下,一间房子里有一些考古学家,生物学家和象棋手,再考虑下述两个论断是真实的:
这里的考古学家都不是生物学家。
所有的生物学家都是象棋手。
从这两个前提中能够得出什么呢?约翰逊-莱尔德发现,很少有人可以给出正确答案。(惟一正确的演绎就是,有些象棋手不是考古学家。)为什么不能?他相信,从上述苏格拉底三段论中得出有效结论很容易,从上述考古学家三段论中抽出结论很困难,是因为这些推论在思维中表现出来的方式——即我们从中创立的“心理模式”的方式。
一些接受过正式的逻辑训练的人通常会以几何图形的形式想象这个问题,可以把这两个前提用圆圈代替,一个套在另一个里面,或者重叠在一起,或者分开单独成一体。可是,约翰逊-莱尔德的学说是以其研究为基础,并通过计算机模拟来求证的。他认为,没有接受过这方面训练的人使用的是一种更为简易的模式。在苏格拉底三段论中,他们无意识地想象着一群人,都有生有死,想象苏格拉底也与这群人有关,因而准备找到任何例外(可以超出这群人的例外,也可能就是苏格拉底)。因为没有这种可能性,因此,他们就正确地得出了苏格拉底有生有死的结论。
然而,在考古学家三段论中,他们先想象并尝试第一种,再尝试第二种,最后是第三个模式,越往后越难(我们在此略去细节)。有些人依靠第一种,不能够看到第二种会使其无效,另外一些人依靠第二种,也没有看到第三种和最困难的一种使其行不通,这也是导致惟一答案的通道。
心理模式不是错误演绎的惟一来源。实验显示,一个三段论的形式很简单,其心理模式也很容易确立的时候,一些人也容易受到自己的想法和信息的误导。一个研究小组问一批受试者说下述三段论在逻辑上是否正确:
所有有发动机的东西都需要油。
汽车需要油。
因此,汽车有发动机。
所有有发动机的东西都需要油。
奥普洛班因需要油。
因此,奥普洛班因有发动机。
认为第一个推论在逻辑上是正确的人,比认为第二个推论在逻辑上是正确的人多些,尽管这两个推论在结构上是一模一样的,只不过是用“奥普洛班因”这个无意义的词代替了“汽车”。他们受到自己对汽车的知识的误导;他们知道第一个三段论的结论是真实的,因而认为这个推论在逻辑上是正确的。可是,如他们在奥普洛班因的情况下所看到的,这个推论是不正确的,他们对奥普洛班因这个词毫不了解,他们可以辨认出来,奥普洛班因与有发动机的东西之间没有必然的重叠在内。
归纳推理:对比而言,归纳推理稍为松动一些,也不是很严密。它从具体的想法向更广泛的概念推进,也就是说,从有限的情形向总体的概括上发展。从“苏格拉底有生有死”,“亚里士多德有生有死”和其它例子中,根据自己对案例不同程度的信心而推出,“所有的人都有生有死”,尽管哪怕一个例外就会使该结论无效。
人类重要的推理当中有很多都属于这一类型。对思维至关重要的范畴化和概念形成都是归纳推理的成果,如我们在儿童如何形成范畴和概念能力的研宪中所知道的。人类所拥有的全部有关世界的高级知识——从死亡的不可避免到行星运动和星系形成的法则——都是从大量具体事例中推出概括的产品。
在模式辨认中使用到的归纳推理也是解决问题的关键。有一个简单的例子:
下个数字是什么?
23569101415——
10岁的小孩子看看之后也会解答这个题;成人可以在一分钟左右看出这个模式和答案(20)。经济学家、公共卫生官员、电话系统设计员和其他许多进行对我们这个现代社会的生存至关重要的模式辨认工作的人,他们利用的正是这个推理过程。
然而,令人不安的是,研究者发现,许多人不会从进入的信息中得出演绎推理。我们经常只注意到支持现存想法的一些东西,并把它们存储在记忆之中,而忽视相反的东西。心理学家把这种现象称作“确认偏差”。丹恩·拉塞尔和沃伦·琼斯让受试者读一些有关超感知觉的材料,有些是确定性的,有些是否定性的。之后,拉塞尔和琼斯对他们的回忆进行测试。相信超感存在的人百分之百记得确定性的材料,而否定性的材料只记得百分之三十九。怀疑论者可以记住两方面的材料达百分之九十。许多类似的偏见研究发现,有强烈偏见或者种族偏见的人从负面的信息中得出有关他们仇恨或者不相信的东西的总结,或者忘记对他们的任何支持性材料。
或然性推理:人类思维的能力是进化选择的结晶,可是,我们在高级文明社会生活的时间太短了,不可能形成对统计性的或然性进行严密推理的天生能力,尽管现代生活极需要这种能力。
丹尼尔·卡恩曼和亚莫斯·特沃斯基都在这个领域里进行过大量工作,他们问一群受试者说他们喜欢哪一种:肯定拿到80美元,或者百分之八十五的机会拿100美元,当然就有百分之十五的可能是什么也拿不到。大部分人愿意拿80美元,尽管统计上的风险平均数为85美元。卡恩曼和特沃斯基作出结论说,人们一般“不愿冒风险”:他们情愿拿到确定的东西,哪怕一个风险项目更值得一赌。
我们再回到正面情形中来。卡恩曼和特沃斯基问另一群人说,他们喜欢肯定赔出80美元,或是喜欢百分之八十五的可能赔出100美元,当然也就有百分之十五的可能是一分钱也不赔。这次,大部分人宁愿赌一赌,而不愿照赔,尽管平均来说,这场赌局代价更大。卡恩曼和特沃斯基的结论是:当在获取中进行选择时,人们不愿意冒险;当在损受中进行选择时,人们会找机会冒一下险——在这两种情况下,他们都有可能作出错误判断。
后来的一项发现更引人注意,他们让一群大学生在两种解决公共卫生问题的版本前作出选择。这两种办法在数学上是相等的,但措辞不一样。第一个版本是:
假设美国正在准备防御一种罕见的亚洲疾病的爆发,它估计会使60O人丧生。有人提出了两种方案来对付该病。假设对这些方案的后果进行的、准确的科学估计如下:
如果采纳A方案,则有可能会拯救200人;
如果采纳B方案,则有三分之一的可能性使600人全部获救,还有三分之二的可能是这600人一个也救不了。
你喜欢哪一种方案?
第二个版本的故事与前面一样,只是措词略有不同:
如果采纳C方案,400人会死去。
如果采纳D方案,有三分之一的可能性是没有人会死去。但有三分之二的可能是600人全部死去。
受试者对这两个版本的问题反应差别极大:百分之七十二的人选择方案A而不是方案B,但百分之七十八的人(另一个小组)选择了方案D而不是方案C。卡恩曼和特沃斯基的解释:在第一版中,结果是以获取(拯救的生命)来描述的,在第二版中是以损失(损失的生命)来描述的。这是与上述金钱方面的实验同样的偏见,受试者的判断受到扭曲,在处于生死关头的生命和处于赌桌上的金钱上是一样的。
我们在这些情况下会作出很差的判断,是因为涉及的因素是“否直觉的”;我们的思维不愿意抓住或然性中的现实。这个缺点既影响个人,也影响整个社会。选民和选民代表经常因为很差的或然性推理而作出一些付出很大代价的决定。如理查德·尼斯比特和李·罗斯在他们的《人类推理》一书所说的,许多政府行为和在危机时期采取的政策都因其后发生的事情而被看作是有益的,尽管这些政策经常是无用或者有害的。错误的判断是由人类的倾向引起的,他们把一种结果归因于产生这个结果的行动,尽管这些结果经常是事物自然的进展所致,是从异常复归正常的自然趋势。
类比推理:到70年代末,认知心理学家已经开始认识到,逻辑学家认为是谬误推理的很多东西实际上是“自然”或者“行得通的”推理——不准确,不严密,直觉型的,而且从技术上讲也是无效的,但经常是合宜的,而且是有效果的。
这样的思维当中的一种就是类比。每当我们认识到,一个问题与另一个不同的问题,即,我们大家都很熟悉也知道答案的问题是可以类比的时候,我们会跳跃式地直接进入结论。比如,许多人在组装一件散落的家具或者机器零件时,根本不看说明手册而直接凭“感觉”动手——寻找各零件之间的关系,并在不同的家具或者机器零件之间寻找他们以前组装过的东西的类同之处。
类比推理是在儿童心理发育的晚期阶段形成的。最近一直在进行类比思维研究的认知心理学家迪德尔·金特纳,她问5岁的孩子和成人说,云彩和海绵在哪些方面相像?孩子们以类似的特点回答问题(“它们都是圆圆的,毛绒绒的”),而成人则以相关的类似点来回答(“它们都吸水,而且都能挤水出来。”)
金特纳把类比推理看作是一个域和另一个域之间的高级关系他说:
在我看来,这些程序里没有一个堪与人类思维过程的复杂性相提并论。“人工智能”程序与人类不一样,它们倾向于是专心一致的,不可能分心,也没有感情。再说,它们一般从一开始就配备有解决一个问题所需的全部认知材料。
然而,这位权威性毫不亚于赫伯特·西蒙的人却从范畴上确定地说,思维和机器是类似的。1969年,在一系列收集在《人工智能科学》一书中的讲座中,他提出,计算机和人类思维都是“符号系统”——能够处理、转变、精确而且一般也能操纵各种各样的符号的物理存在。
在整个70年代,专心至致的心理学家中的少数人和麻省理工学院、卡耐基-默伦大学、斯坦福大学和其它一些大学的计算机科学家们狂热地相信,他们已经面临着一种巨大的突破,因而开发出一些既可以说明思维的工作原理,也是人类思维的机器翻版的程序来。到80年代初期,这项工作已经扩张到了好几所大学和一些大公司的实验室里。这些程序可以执行像走国际象棋、对句子进行语法分析、把一些基本句子从一种语言翻译成另一种语言和根据大量光谱数据推论出分子结构这样一些各种各样的活动。
狂热者认为信息处理解释思维的工作原理的能力无边无际,人工智能通过执行同一些过程而检测这些解释的能力也没有什么限制,他们相信这些程序最终会比人类做得更好。1981年,哥达德太空研究院的罗伯特·杰士特罗预测说,“到1995年左右,按照现在的趋势,我们将看到硅制的大脑这种突然出现的生命形式,它们会与人类展开竞争。”
可是,跟赖塞尔一样,有些心理学家感觉到,计算机只是对思维某些方面的机械模拟,心理过程的计算模式只是很差的一个方面。赖塞尔本人到1976年的时候,也对信息处理模式“非常失望”,当时,他出版了第二本书,即《认知及现实》。赖塞尔深受詹姆斯·吉布森和他的“生态”心理学的影响,他在该书中提出,信息处理模式太过狭窄,与现实生活中的知觉、认知和有目的的活动离得太远,而且不能把我们从周围的世界里持续不断地吸收到的经验和信息考虑在内。
其它一些心理学家虽然没有说他们深感失望,但他们还有想办法扩宽信息处理的观点,以将思维对概要、捷径和直觉的利用,以及其同时在有意识和无意识层次上并行展开模拟过程的能力(这是个关键的话题,我们随后将谈到这一点)。
还有另外一些人提出了挑战,认为一些编好程序,以便像人类那样去思维的计算机根本就没有在思考问题。他们说,人工智能一点也沾不上人类智力的边,虽然它也许在计算方面远胜人类思维能力,可是,它却永远也不可能轻松地,或者完全不可能从事人类思维日常毫不费力就能完成的工作。
最为重要的差别在于,计算机不能理解它自己正在思考的问题。约翰·塞尔和休伯特·德赖弗斯两位都是贝克莱的哲学家,还有麻省理工学院的计算机科学家约瑟夫·魏森包姆以及其他人都认为,计算机在按编程进行推理工作时,只会操纵符号,根本不了解这些符号的意义或者含义。比如,总体问题解决器也许能够推算出父亲和两个孩子怎样过河,但是,它们只能以代数符号进行这项工作;它不知道一只船、父亲和孩子是什么,“沉船”以后会意味着什么,他们沉下水里后会发生什么事情,也不知道这个现实世界里的任何东西。
这些设计用来帮助人们进行问题求解工作的程序,一般会用英语问这些操作程序的人,用答案和它们自己存储的知识在一种推理的决定模式上移动,从死点上走开,把寻找范围缩小,最后到达一个结论,对此,它们再分配一个比率(“诊断:红斑狼疮;可靠性:O.8”)。到80年代中期,几十种这样的程序已经在日常的科学实验室里、政府部门和工厂里使用着,到80年代末,这个数字已经达到数百种之多。
然而,虽然专家系统的聪明之处是一些银行计算机、航空订票处的计算机以及其它一些场合的计算机所不具备的,但是,在现实中,它们不知道它们所处理的现实世界信息的意义,不是我们了解的那一种。卡杜塞斯是一种内科咨询系统,它可以诊断五百种疾病,诊断效果与高级医疗人员可以说相差无几,可是,一本权威的教科书,《建立专家系统》却说,它“对所涉及的基本病理生理学过程一无所知”,也不能思考一些处在它的专业知识以外,或者处在其周围的医学问题,哪怕只需要最普通的常识也不行。一种医学诊断程序在一位用户问及羊水诊断是否有用时也不能够提出反对意见;这位病人是位男士,而系统却不能够“意识”到这是个荒谬的问题。如约翰·安德森所言:“人类专家能够很好地解决的一些难题就是了解可以利用知识的环境。一台逻辑发动机只有在环境被仔细地规定好了以后才会得出合适的结果。”可是,为了像人类那样广泛而丰富地确定环境,将需要无法想象的数据和编程工作量。
除了其它一些反对人工智能会思想的论断的说法以外,还有下面这些意见,它们是由许多心理学家和其它的科学家提出来的:
——人工智能程序,不管是专家系统型的,还是具有更广泛推理能力的程序,它们都没有对自我的感觉,也不知道它们自己处在这个世界里的位置的感觉。这就严重地限制了他们进行现实世界思考的能力。
——他们不能,至少目前不能直觉地,或者大致地推理,也不能创造性地思想。有些程序的确能够生成新的办法来解决一些技术问题,可是,这些只是对现存数据的重新组合。另外一些程序写出了诗歌,编出了音乐还画出了油画,可是,它们的产品并不能在艺术世界里留下痕迹;如约翰逊博士的经典说法,它们“就像是狗踮着脚走路。走得不太好,可是,你会很吃惊地发现,它竟然能走了。”
——最后,它们没有感情,也没有身体的感觉,尽管在人类当中,这些都会深刻地影响、指导而且还经常误导思维和决定。
尽管如此,信息处理的比喻和计算机都已经在人类推理能力的调查中发挥了至关重要的作用。信息处理模式已经产生了大量的实验、发现和有关以系列方式发生的认知过程的洞见。而信息处理学说可以建立在上面,并得以确立或否定的计算机已经成了无法估价的实验室工具。
然而,信息处理模式的缺点和人工智能模拟的局限都已经在过去的10年里,导致了认知革命的第二阶段的到来:即修改极大的信息处理范式的出现。它中心的概念是,尽管信息处理的串行模式适合认知的某些方面,但是,大多数——特别是更为复杂一些的心理过程——都是一种很不相同的模式,即并行处理的结果。
事有奇巧——也许可说是不同思想的互相滋润——这与最近的大脑研究结果十分相符。最新的大脑研究显示,在心理活动中,神经脉冲不是沿单向通道从一个神经元向另一个神经元前进的,它们是通过多种内部交流电路的同时激发而自发产生。大脑不是一个串行处理器,而是一台庞大的并行处理器。
与这些发展相匹配的是,计算机科学家们一直在创立一种新的计算机建筑模式,连锁和内部交流处理器可以并行工作,以极复杂的方式影响彼此的操作,可以比串行计算机更接近大脑和思维的运作。这种新的计算机建筑不是以大脑的神经元网络为模式的,因为它们当中的大多数仍然没有绘制成图,也太复杂了,复杂得无法复制,可是,它的确可以用自己的方式进行并行处理。
这三种发展的技术细节不在本身的范围之内。可是,它们的意义和重要性却是本书必须重视的。让我们来看看可以怎样利用这些东西。
新模式
一位法国数学家亨利·彭加勒1908年花了15天的时间想研究出法奇森函数理论,但没有成功。他接着放下工作进行一项地质探险活动。正当他上汽车与一位同行的旅行者谈话时,答案突然出现在他脑海里,非常清晰,毫不含糊,他甚至没有中止自己的谈话以便验证这个理论。当他后来去验证时,答案证明是正确的。
创造力的年鉴里满是这样的故事;这表明,思维可以同时进行两种(或者更多)思索,一种是有意识的,另一种是无意识的。传说不是科学证据,但是,在认知革命的早年,好多种对注意力进行的实验的确证明,思维不是一种单一的串行计算机。
这样的实验中最出名的一项是在1973年进行的。实验者詹姆斯·拉克纳和梅里尔·加勒特告诉受试者们戴上耳机,只注意左耳听到的东西,而不管右耳听到的内容。他们的左耳内听到的是一些含义模糊的句子,比如:“这位军官弄出火苗,示意进攻”;而同时,有些人在右耳却可以听到一个句子,可以清楚地解释一个模糊的句子,如果他们注意听的话。(“他把灯熄掉。”)而其它一些人听到的却是一些不相关的句子。(“红人队今夜要连赛两场。”)
事后,没有哪一组能够说出他们的右耳听到了什么。可是,当问及含义模糊的句子的意义时,那些用右耳听到不相关句子的人被分成两组了,一组是听到含义模糊的句子后说是扑灭火苗,另一组是听到句子后说是弄出火苗来。大多数听到过解释性句子的人都说是扑灭了火苗。很明显,解释性的句子被同时和无意识地与模糊的句子一起处理了。
这是好多理由中的一个理由,说明70年代为什么会有一些心理学家开始提出一种假设,说思维不是串行处理的。另一个原因是,串行处理不能解释大部分的人类认知过程,神经元太慢了。它是以毫秒进行操作的,因此,发生在一秒左右时间内的人类认知过程只能补偿不到100个串行步骤。很少有过程是如此简单的,而许多过程,包括知觉、回忆、语音读出、句子理解和“配对”(面孔辨认模式)在内,都要求大得多的数字。
到1980年左右,一系列心理学家、信息理论家、物理学家和其他一些人开始开发详细的并行处理系统工作模式的理论。这些理论特别专业,涉及高等数学、符号逻辑、计算机科学、概要理论和其它的神秘莫测的东西。可是,这场运动的领袖之一大卫·鲁麦哈特最近以简单的话,总结了鼓励他和15位同事开发出自己的“并行分配处理”(PDP)理论的那种思想:
尽管大脑的元件很慢,可它们的数量庞大。人脑装有数十亿这样的处理元件。它不是组织许多串行步骤的计算,如我们在一些步骤很快的系统中所看到的一样,人脑一定是在用许许多多的单元以协作和并行的方式执行它的活动。除开其它的以外,这些设计特性我相信会导致对计算的总体的组织,它与我们已经习惯的方式一定有很大的不同。
PDP还在对信息如何存储的解释上面与当时使用的计算机比喻有很大的不同。在计算机中,信息的存储是以其晶体管的状态保留下来的。每只晶体管要么是开着,要么是关闭的(代表0和1),一连串的0和1代表用符号表示的各种各样的信息的数字。当计算机运行时,电流保持这些状态和信息,当你关掉机器时,一切就会丢失。(依靠磁盘进行永久存储完全是另一码事;磁盘在操作系统之外,正如书面的记事薄处于大脑之外一样。)大脑不可能是按这种方式存储信息的。一方面,神经元不可能是开或闭的状态,它会从其它成千上万的神经元中增多输入,在到达一定量的激发时,会把一个脉冲传送到其它神经元中去。可是,它保持激发状态的时间不会超过几分之一秒,因此,只有很短时的记忆是通过神经元状态存储起来的。而且,由于记忆在大脑因为睡眠或者因为麻醉而处于无意识状态时不会丢失,事情一定是,大脑中的长期存储一定是以其它的某种方式获取的。
这个因为大脑研究而获得的新观点是,知识不是以神经元的状态而存储的,而是通过经验形成的神经元之间的连接形成的,或者,如果是机器,就是在一种并行分配处理器的“单元”之中。如鲁麦哈特所言:
几乎所有的知识都包含在执行任务装置的结构之中……它就装在这个处理器本身里面,直接决定处理的途径。它是通过对连接的调谐获取的,因为这些东西就在处理中使用,而不是作为说明性的事实形成和存储起来的。
这种新的理论相应地也就称作“连接主义”,这是当前认知学说中第一号新词。过世的艾伦·纽厄尔不久前说,连接主义者认为他们的学说是认知心理学的新范式,他们的运动是第二次认知革命。
鲁麦哈特和两位同事划的一张图可以使PDA学说更清楚明白一些,如果你愿意花几分种时间分析一下的话。它不是大脑某块组织的细图,可是理论化的连接主义者所认为的网络图的一部分:
连接主义者所认为的网络假想图例:
第1到第4单元接受外部世界的输入(或者这个网络的其它部分),加入来自第5到8单元输出的反馈。这些单元之间的连接是由没有标上数字的圆圈象征性地指示出来的:打开的圆圈越大,连接越强,填满的圆圈越大,受抑制越强,传递的干扰就越大。因此,第1单元不影响第8单元,但会影响第5,6和7单元,影响的程度各个不同。第2,3或者4单元都影响第8单元,影响的程度很不相同,而第8单元反过来也向输入的单元发出反馈,对第1单元的影响几乎没有,对第3和4单元的影响很小,对第2单元的影响极大。所有这些都是同时进行的,并得出一个输出排列,与信号过程和并口设计中的信号输出形成对照。
尽管鲁麦哈特及其同事说,“PDP模式的吸引力毫无疑问会因为其生理可行性和神经灵感而得到极大的加强”,但是,图中的单元不是神经元,其连接也不是突触连接。这个图代表的不是一种生理的存在,而只是里面发生的事情;大脑的突触和这个模式的连接是以不同方式运作的,禁止某些连接,而同时又加强另外一些连接。在两种情况下,这些连接是这个系统知道的东西,也是它对任何输入作出的反应。
这里有一个简单的图示:在这幅图中,被墨迹部分盖住的是什么字母?
你可能立即会说,被盖住的这个字是RED(红色)。可是,你怎么知道的?盖住的每个字母都有可能是别的字母,而不是你所认为的那一个。
鲁麦哈特和杰伊·麦克莱兰德对你的猜技是这样解释的。第一个字母里面的竖线是输入你的认知系统的一个输入,它与存储着R,K和其它字母的那个单元有很强的联系;斜线连接着R,K和X。另一方面,看见这些线条中的每一根并没有跟——人们也可以说禁止跟——代表圆角字母如C或者O的单元连接起来。同时,你从第二个字母中看到的东西与登记着F和E的单元有强烈的联系,因为经验已经确立了RE但没有把RF当作一个英语单词的开始。以此类推。许多连接都在同时并行操作,它们使你能够立即看到RED这个词,而不是任何别的词。
在更大的一个范围里来说,信息处理的连接主义模式与认知心理学研究中其它开创性发现的成果十分吻合。比如,我们可以考虑一下图39中的语义记忆力网络中已知的东西。网络中的每一个结点——比如,“鸟”、“金丝鸟”和“歌唱”,都对应于某个连接主义模块,有点像最后一个图中全盘的排列,但也许是由成千上万个单元而不是这八个单元构成的。想象一下,足够多的该类单元模块会登记下存储于大脑中的所有知识,每个模块都与相关的模块有好几百万种连接,而且……可是,这种任务对于想象来说的确是太浩大的一个工程。连接主义者的思维建筑不再有可能把它整个的图景像表现宇宙结构一样表现出来。
连接主义模式是对实际大脑结构和功能的强烈类比。弗朗西斯·克里克曾因与人共同发现了DNA结构而分享了诺贝尔奖,现在又在索尔克研究院研究处于前沿阵地的神经科学,他说,大脑的概念作为一个复杂的大型并列处理器层次结构,“几乎可以肯定地说是沿着右边的线路前进的。”保尔·切尔奇兰和帕特里夏·切尔奇兰都是认知科学中的哲学家,他们总结当前的大脑结构知识时说,大脑的确是一个并行机器,“信号是同时在成百上千万不同的通道中进行处理的”。神经元的每一种集合都会向其它集合发送成百上千万的信号,并从这里接受返回信号,用以修正其这种或那种输出。正是这些反复不断的连接模式才“使大脑成了一台真正充满动力的系统,它连续不断的行为既十分复杂,而在某种程度上又不依赖于其周边的刺激”。因此,笛卡儿才有可能整个早晨躺在床上胡思乱想,正如许多心理学家后来也如法炮制的一样。
也许,最了不起的发展是计算机与思维之间的关系的变化。一代人之前,好像是说计算机是一种模式,通过它,推理的思维可以被理解。现在,这个秩序反过来了。会推理的思维是一个模式,通过这个模式,更聪明的计算机就可以建成了。最近几年,计算机工程师们一直在设计和建造并行计算机,其线路的连接将会使64000个处理单元同时操作,并彼此发生影响。同时,人工智能研究者也在编写程序,使其能模拟小型神经网络的并行处理,这种模拟相对于约1000个神经元。他们的目的是多重的:要创造比基于串行处理更接近聪明一些的智能程序,要编写出能模拟假设的心理过程的程序,这样,它们就可以在计算机上进行测试。
这是一个很好的嘲讽:使思维成为可能的大脑到头来成了一种机器的模型,而这种机器一向被认为比大脑聪明一些,这个模型是如此复杂,如此繁锁,以致于目前只有计算机才能干好这件事,只有计算机才能处理对它进行的微型模拟。
如最伟大的的赞美诗作者大卫在25个世纪以前,在认知革命和计算机时代之前所赞叹的:“我要称赞您;因为我是在惶恐中诞生,我乃天赐而成。”