我们已经从空间学习、语言学习的例子中相信了必有某种认知过程存在于人的体内。那么这种认知过程是什么?或者至少如何刻画?
1975 年 Turing 奖授予了经济学家、政治学家 Simon, H. 和计算机科学家 Newell, A.,以表彰他们对人工智能研究的贡献。他们的工作也对认知科学影响甚大,因为在那个年代人工智能的研究并不像现在(2025)一样关注于工程和实用上的表现,而更加有认知科学旨趣,即关切真正的脑和心智的运作,也就是试图从概念、哲学和科学上理解「智能」这个概念。他们在向公众解释他们的 Turing 奖工作时,概括了他们对智能的看法:
物理符号系统假设, Physical Symbol System Hypothesis 一个物理符号系统就是进行通用智能行为的充分必要方式。
对他们来说,所谓物理符号系统具有以下特性:
- 符号是一些物理图案
- 符号能被组合成复杂的符号结构
- 物理符号系统有操控符号和符号结构的机制
- 这里的机制对应日常例子就是算法。
- 产生和变换符号结构的机制,本身可被系统内的符号和符号结构表征
- 一般用途计算机可以模拟特种用途计算机器,因为一个符号结构包含了另一个符号结构的信息。正如 Turing 很早就指出的那样,一个 Turing 机可以编码到另一台 Turing 机上,成为其上的「虚拟机」。
- 问题的解决靠生成和修改符号结构,直到找出解为止
- 智能就是在搜索空间内得出解的机制或算法。
但这个假设还是笼统而模糊,比如符号结构是什么样的结构,它们如何变换,变换又如何给出了人类拥有的智能行为。
哲学家、认知科学家 Fador, J. 首先考察了信念—愿望心理(belief-desire psychology),或称命题态度心理(propositional attitude psychology)。他注意到人们尤其擅长描述自己和他人的信念和愿望并作出反应,认为这种描述和反应尤其需要解释。首先描述之所以能行是因为信念和愿望必是某种实在物,此即意图实在论(intentional realism)。其次对信念和愿望的内容如何在心智中的表征导致了人的行动,即内容导致的因果(causation by content),Fador 的解释如下。由于我们似乎只有脑和表征的物理性质(形式性质)是物理实体,也就是说脑能处理的只有表征的形式性质,但表征的形式性质却完全对应到表征的对象,也就是表征的语义。结合逻辑学常识,Fador 断言到心智的语言必是某种形式语言,且具有类似于一阶逻辑的完备性*和可靠性**的元逻辑性质,从而表征的形式性质确实可以等同于表征的语义,解释了表征可以导致行动,即内容导致因果。根据这个考察,Fador 的心智观点可以总结成如下假设:
思维语言假设,Language of Thought (LoT) Hypothesis 心智中的基本的符号结构(如在意图实在论下的信念、愿望)就是思维的内语言(心语,Mentalese)中的句子。信息处理机制就是在 LoT 内变换句子。
* 语义上为真的命题,必在形式系统存在语法上的证明。
** 若语法上存在证明,该命题语义上必为真。
总结 Simon-Newall 和 Fador 的观点,我们可以声称符号*系统为一个具有语法**和语义***的图案的系统。物理符号系统假设也就是再说心智的计算主义(computationalism,也称心智的经典计算论,classical computational theory of mind):
心智无非是经典计算机,一个用算法来处理编码于符号的信息的物理机器。
换句话说,计算主义的字典是
心智 = 程序,处理符号的软件
脑 = 工程品,实现该程序的硬件
认知 = 实现了心智程序的机器
在这种看法上,人工智能完全可行,因为无非就是在人工的或者非生物学的机器上跑认知程序或者算法,程序当然在不同的工程品上多重可实现(multiply realizable),认知程序从而也理当可以运行在人类的神经元、外星人的生理学、Intel 芯片。
* 可重复的物理图案
** 符号的集合及其形成规则
*** 符号的解读方式
心智计算主义至少是一个很有意思的看法,那它的证据如何呢?哲学家 Perirce, C.S.(1886) 和数学家 Shannon, C.(1940) 各自证明了电路可以表示逻辑运算。神经生理学家 McCulloch, W. 和数学家 Pitts, W. 将神经元的阈值激活看作是电路开关*,神经传导看作是逻辑门,说明了逻辑推理可被神经系统实现,神经系统至少在理论上可以发生经典计算。
实践上,Newell 和 Simon 在1956年开发了 LOGIC THEORIST 程序来从 Rusell 和 Whitehead 的 Principia Mathematica 中的公理证明定理**。IBM 工程师开发了 DEEP BLUE 在1997年打败了国际象棋冠军 Kasparov, G. 这些都是专家系统,专注于特种领域的特种目的程序,它们有更少的认知需要,从而搜索的空间的更小,可以用来建模脑模式。2011年 IBM 开发的混合经典算法和连接主义网络的,利用自然语言处理、知识表征、自动推理、机器学习的程序 WATSON 在电视节目 Jeopardy 上打败对手***。这里 WASTON 不是专家系统,而是一个通用目的的系统,可以用来建模一般思考者。
* McCulloch, Pitts. A logical calculus of ideas immanent in nervous activity. Bulletin of Mathematics Biophysics 5 (1943).
** Newell, Shaw, Simon. Empirical explorations of the logic theory machine. In: Feigenbaum and Feldman, Eds. Computers and Thoughts (1963).
*** https://www.youtube.com/watch?v=WFR3lOm_xhE
连接主义(connectionism)「或许」是另一个故事。一个连接主义系统是说它是由亚符号单元或者节点组成的层,相互连接于或正或负的信号。「亚符号单元」将它区别于经典符号系统,意思也就是说,节点自身并不是用来表征的符号,但他们却可以连接起来共同表征事物。可以预期它们比起经典计算系统在功能上更像人脑。
连接主义系统的学习方法有 Hebbian 学习、后向传播。值得注意的是这种学习方法并非行为主义学习,虽然它们都涉及了联结。首先,机器内不同节点层的连接,并非只是刺激和反应的联结。其次,里层可能有多个连接主义系统,共同在刺激和反应之间形成一个复杂的内部系统。
实践上,Gorman, P. 和 Sejnowski, T. 构建了矿物探测的模式识别系统。Rumelhart, D. 和 McClelland, J. (1986),Plunket 和 Marchman (1993)的网络成功模拟了时态学习的不同阶段。MIT 实验室*构建的连接主义网络在训练了600小时电视剧之后,可以在根据一秒长的视频以43%**的准确率判断其中出现的两个人将要亲吻、拥抱或是握手。这显示了连接主义系统可以发生社会知觉。
* https://news.mit.edu/2016/teaching-machines-to-predict-the-future-0621
** 由于有三个候选项,随机猜测的中立概率是33%。成年人类准确率是71%。
在计算主义和连接主义之中,也有人持平等立场。相容主义(compatibilism)看法认为连接主义系统实现了经典计算系统,也就是说连接主义不是竞争品,而根本上就是不同经典计算规则的底层描述,就像细胞是肌肉、心脏、脑的共同底层实现一样。