当前正在发生的这场人工智能革命,实质是一场“退回到原点的运动”,由此所引发的讨论,在某种意义上也是对人类“智能”认识的大倒退。所有这一切都和人文精神的沦丧有关,特别是对人工智能的发展历史的忽略。
连接主义和行为主义视角下的智能:自动机理论
早在“人工智能”这一观念出现以前,AlphaGo的工作原理已经被数学家和生理学家发现了。1948年,美国应用数学家诺伯特·维纳提出了“控制论”,促使智能研究的行为主义大转向。与今日人工智能研究直接相关的,是当时的自动机理论,麦克卡洛和匹茨的神经网络模型就是这类自动机之一,其被视作人工智能研究的连接主义学派(其对智能的认识也是行为主义的)的开创者。
就记忆本身而言,AlphaGo通过人喂给它的大数据或下棋的胜负得到的记忆,只是智能所具有的各种记忆中的一种,即最初等的“默会知识”。心理学研究早就指出:记忆分“陈述性记忆”和“非陈述性记忆”。默会知识是非陈述性记忆,比如骑自行车、游泳等,人们可以通过实践(反馈学习)来获得,但却不能用语言来描述它,甚至主体都不知道自己“为何知道”。另一种是陈述性的,也就是人类能够以符号系统予以表述的知识,其可以被传递、重构、遗忘甚至歪曲。行为主义和连接主义对智能的认识很大程度上只停留在其非陈述性的一面。
//大语言模型似乎模糊了非陈述性记忆和陈述性记忆的界限,因为它能用语言来“陈述”它学到的知识。但是,作者的论点根植于这种陈述背后是否有真正的理解和主体意识。LLM的“陈述”是基于其庞大数据库的概率生成,而不是一个有意识的主体在表达自己的认知。其本质上仍然是基于海量数据的统计规律进行学习。它通过神经网络,学习了人类语言这个庞大符号系统中词与词之间的概率关系。它能生成流畅的语言,是因为它计算出了在某个语境下,哪个词或句子出现的概率最高。
如果没有陈述性记忆,知识不能经理性加工、传递,亦不能社会化。也就是说,仅仅用非陈述性记忆是无法理解最简单的智能的。
//如果我们把 LLM 看成是一个符号引擎:它的原语就是预测下一个 token,prompt 就是程序,那么真正的前沿,不在于让它不断重复“总结文章、翻译文档、生成样板代码”这些低阶功能,而在于推动符号进入新的疆域。人类文明的发展,本质就是不断扩大符号的可表达范围。法律把权力符号化成条文;数学把直觉符号化成公式;音乐把情感符号化成谱号。每一次扩展,不仅是对已有知识的传播,更是创造出全新的知识形态。
事实上,20世纪50年代末,心理学的行为主义学派受到广泛地批评,控制论研究的第二阶段开始了。智能有了更为深入也较为准确的定义,人工智能的研究从此起步。在此意义上,今日忽略对行为主义的批评、回到控制论刚兴起时状态的“人工智能革命”,是某种对智能认识的倒退。
什么是智能 ?符号主义下的人工智能
什么是陈述性记忆?这是主体使用符号来表达对象及形成的记忆,它比行为主义更接近智能之本质,这就进入到智能研究的另一个学派——符号主义。
艾什比是早期控制论的另一位代表人物,他对智能研究最大的贡献是,第一次给出了“智能”的较准确的定义。什么是智力?艾什比认为智力是进行正确(合适)选择的能力,选择能力的放大即为智力的放大,整个智能行为包含着符号(一种特殊的信息)之选择、编码、传输和解码,以及上述过程的自我叠代(和反馈相对应)。[4]符号(信息)选择的过程一旦实现自动化,可以说是有智能的。这就是符号主义学派创始人西蒙和纽厄尔所提出的“物理符号系统假说”(PSSH, Physical Symbol System Hypothesis)。它可以概括如下:“任一物理符号系统如果是有智能的,则必能执行对符号的输入、输出、存储、复制、条件转移和建立符号结构这样6种操作。”
用符号运算类比人的智慧,比神经网络自动机更为高级,其形成的以及处理的符号系统,更接近由理性学习得到的陈述性记忆。但为什么随着电脑运算的进步和大数据的出现,这一对智能更准确定义的领域中没有发生革命?反而是在神经网络自动机的领域中出现了突破呢?关键在于,西蒙和纽厄尔在艾什比的基础上,虽然将人们对“智能”的理解向前推进了一大步,但仍然没有把握人类智能。人类智能不同于生物本能之处在于,人不仅具备选择的能力,还具备创造符号以及利用符号系统把握世界、并赋予世界意义的能力。
在数学符号系统的运行规则背后,起码还存在如下四个层面,它们才涉及智能的本质。
第一,主体是自由的,可以给出符号并用符号系统指涉对象。语言就是这样的符号系统;
第二,人用语言传递知识,组织社会,产生社会行动。这一切会反过来使主体意识复杂化,社会意识由此起源;
第三,人会意识到自己有自由意志,让意志指向某种符号系统,创造一个应然世界;
第四,应然世界的演变会进一步放大主体的自由,以创造出更为复杂的符号系统。数学只是人创造出来的众多符号系统中最不可思议的一种,数学真实具有和经验世界不同的真实性标准。
而人工智能的符号主义学派,其所着眼的智能只是第四个层面上的一小点(即数学推理)。当智能之冰山主体(即上述四个层面)还在水下,仅仅看到冰山之一角,我们能把握智能吗?当然不能!换言之,虽然对智能的符号主义认识比神经网络自动机深入得多,但仍然是瞎子摸象。用电脑科技和大数据实现的,只能是那些完全搞清楚的东西。今日人工智能讨论的巨大盲点在于,很多人把生物的本能当作人类智能。
《关于意识的哲学思考》一文,指出意识的解释必须将行为主义方法和内省方法结合起来。如果没有行为主义模型,该研究不能通过实验来证明。但意识决不是仅仅靠输入-输出的因果性模式能把握的,故必须把因果模型和内省变量结合起来。在此意义上,必须意识到意识的解释不能排除意识。正因如此,在人类智能研究中,必须发展出一种将科学与哲学结合在一起的新方法。即意识解释的递归方案。
伴随对意识研究的深入,实验测量与人文思辨的界限会越来越模糊。但是这两类变量仍是不可以化约的,其根本原因是人有自由意志,即人的主体性。它不可能被还原为因果性。
被忽略的内核:主体的自由
如果我们承认人是动物进化来的(这一点似乎毋庸置疑),既然AlphaGo这样的智能只相当于动物本能,为什么不能想象如同物种演化那样,具有生物本能的神经网络在学习过程中突然涌现出人类智能呢?这正是当前人工智能讨论中另一个经常使人们进入误区的观点。
确实,能否使用符号是人和动物的本质区别。早在19世纪,德国哲学家恩斯特·卡西勒指出人是会使用符号的动物,人的“智能”可以更准确地定义为创造符号及其使用规则,并自由使用符号来与同类交流的能力。这一定义是当前科学界的共识。前面我在论述人类智能四个基本层面时,每一个层面都涉及创造和使用符号。正因如此,从动物向智人的飞跃亦被简化为发明符号和使用符号,它是用系统演化中的“涌现”来说明的。
《人类简史》勾勒出人类使用符号对社会形成的意义,以及文化如何加速人类智能的进化,这无疑是正确的。但却没有揭示人创造符号、使用符号沟通、建立社会,以及文化演变背后起关键作用的内核,容易使人忽略人类智能和社会之间的关系,从而导致对智能“涌现”和加速进步的错误概括:这些能力似乎可以仅仅从神经网络自动机的学习过程中自行产生出来。
智能(社会性)进化的三种力量
-
第一,创造和使用符号需要一种仅仅通过反馈学习的神经网络自动机不可能具有的能力,这就是主体的自由。
-
第二,当人通过语言组织成社会后,自我意识开始复杂化。在这一过程中会发生突变,这就是人可以进一步意识到自己(主体)是自由的。“人是自由的”乃是创造符号之前提,而“人知道主体是自由的”是一种二阶思维,即对自由的自我意识。这是主体性又一巨大进步,它通常被称为人具有自由意志。
-
智力进步第三种更重要的力量,来自于人终于认识到自己应该是自由的。这是什么意思?人知道自己是自由的,并不意味着个人自主成为社会组织原则。在传统社会,自主的个体生活在终极关怀或道德价值规定的有机体内,他们的合作和创造力的发挥一直受到有机体“容量”的限制。只有人认识到自己应该是自由的,自由的意义才能超越其他价值,成为“应然社会”的组织原则。现代科学的诞生是智能最伟大的革命,它和现代市场经济的出现同步,其背后是一种可以容纳自主个人无限制发挥自己创造性,并和其他主体合作的社会组织方式。这一切可以归为“自主性成为应然社会的组织原则”。从人类智能摆脱了种种天然桎梏并开始突飞猛进,到人工智能研究有可能出现,都是基于现代社会的起源并日益成为人类文明的组织框架。
//现代社会起源的起点是什么
当前的LLM
大语言模型(LLM)的确在纯神经网络训练后展现出大量“智能样”能力与显著推动效率/进步;然而,这种“涌现”并不是在真空里自发生长,而是深度寄生于人类早已建构的符号与社会生态(语料、语言规范、知识体系、评价与对齐流程、工具使用范式)。作者在文中强调“主体自由—符号创制—社会建构”的内核,这一点,LLM 仍未具备;它更多是在复用与重组该内核所产出的符号成果,而非自身生成该内核。
数据与目标不是“自生”的
LLM 的训练语料是人类长期的符号与社会产物(语言、科学论文、代码、制度文本……),优化目标也由人设定(监督学习、RLHF/RLAIF 的偏好对齐、红队规范)。因此,模型能力的“涌现”是在吸收人类符号秩序后的统计泛化,而非从“无符号社会”的连接主义系统中凭空出现。这与文中要求的“主体自由→符号创制→社会建构”的生成路径并不等价。
意向性/主体性仍是外置的
当前 LLM 的基本目标函数是预测下一个符号,并不自带“我想要达成 X”的内在意向;其“对齐”与“工具使用”多由人类流程与系统工程外接(检索、执行器、代理框架、记忆/长期规划由外部系统承载)。作者所说的“主体自由”“应然世界”与“价值组织原则”,仍是人类社会提供而非模型内生。
“创造新符号” vs “重组既有符号”
LLM 可以造新词、拟新概念,但赋予可持续语义并被共同体采纳才算“符号创制”。目前这些“新符号”的社会落地、制度化与代际传承,依然依赖人类共同体(出版、学术评审、标准化、市场采纳)。这更像高效的符号重组器,而非独立演化的“符号—社会系统”。
“加速进步”是人机—工具—制度的复合效应
生产力的跃迁来自:模型 + 检索/执行工具 + 工作流编排 + 组织结构/产权激励 + 法规/市场反馈。把这全部归因于“神经网络自动机本身”,会忽略社会—制度—人类主体在闭环中的作用,正是文中提醒的盲点。
关于今天LLM的结论
LLM 的“智能样”表现更像对人类符号文明的高维压缩与高效重组,而非独立于人类主体与社会的内生符号—社会系统。因此,原文的提醒有其正当性,但需要承认:连接主义 + 大规模人类符号语料已经能实现远超以往预期的智能表现与效率跃迁。
若未来系统在最小化人类语料与外部对齐的条件下,仍能展示下列迹象,才算触碰作者所指的“内核”:
- 闭域内生符号化:在全新、低语料环境中,多个模型体自发约定、演化并稳定使用新符号,其语义可外显、可传承、能支撑复杂协作。
- 内生意向性与长期体内对齐:无外部奖励、无人工对齐,系统可形成并维持一致的长程目标与规范,并能进行“应然层面”的自我约束与冲突调解。
- 社会制度的内生演化:自主形成协议、分工、纠纷处理与升级机制,能在非平稳环境中保持可持续“文明化”。
若这些出现,才有力地反证“只能从人类社会外部汲取符号”的观点。
连接主义的深度学习在摄取海量人类符号产物与外部对齐/工具栈后,已经涌现出广泛的智能样能力并显著加速知识生产;但符号的内生创制、主体自由与社会制度的自组织仍主要由人类共同体提供与维持。因此,当下的“AI 加速”更像人机合成的社会技术体系的产物,而非“脱离人类主体与社会,仅凭神经网络自动机即可自发生成完整智能与社会性”的过程。
//大语言模型的原语是预测下一个 token,这意味着它的通用性仅仅延伸到能够被符号化、能够以语言表示的领域。法律合同?可以。诗歌?可以。数学证明?有时勉强可以。LLM 可以把一切符号化的任务压缩为“意义的延续”,但具身经验、默会知识、非符号化的直觉,依旧标记着模型的疆界。它可以模仿人类如何谈论这些经验,却无法真正生成经验本身。
小结
以功能性视角,从外部看,大语言模型确实通过神经网络学习,自行产生了强大的、看似智能的行为,并且在加速进步。这是一个事实。
若看本质,这种“智能行为”背后的驱动力是什么。人类智能的本质是自由意志和主体性,这是一种从0到1的创造能力 。而当前的人工智能(包括LLM)是在模仿和优化一个已经存在的、由人类创造的符号世界,是一种从n到n+1的优化能力。
LLM 处理数据的能力越强,就越说明它是一个强大的工具和模仿者。但它仍然没有发展出自己的语言,没有创造出一个应然世界(关于道德、价值、意义的世界),更没有意识到自己是一个‘自由的主体’。所以,它今天的成就,仍然是我所说的‘退回到原点的革命’ ,即将复杂的、包含主体性的人类智能,错误地等同于高效的、基于反馈学习的生物本能。