无穷的开始——复杂性理论

2025年6月18日 01:09:44

原文地址:https://x.com/feltanimalworld/status/1933626312209453407

无穷的开始——复杂性理论

经验主义

这是《无穷的开始》一书中一个具有颠覆性的根本性观点,也可以说是整个现代科学方法论的分水岭:经验主义(Empiricism)并非完全错误,但它极其不完整。

在传统观念中,经验主义主张所有知识都源于感官经验,人类无法超越经验获得真知。然而,这种看似“脚踏实地”的信条背后隐藏着两个未经质疑的前提:

我们知道要观察什么;
我们知道如何从观察中得到意义。

这两个前提恰恰不是经验本身给予的,而是先验的理论结构赋予的。也就是说,所谓“观察”本身,其实早已被我们的大脑通过理论框架筛选、聚焦、赋义——脱离理论的观察,是无源之水、无的放矢。

这个问题在东亚教育体系中尤为尖锐。很多人从小接受“做题式”训练,习惯于等待标准答案,从不主动提出自己的假设或解释结构。你是否有过这种经验:你脑中其实隐隐有种解释,但从不敢说出口,因为你知道,一旦说出来,就可能遭到“老学究”的攻击、质疑与否定。这种文化氛围将猜测视为“轻率”,将提出未证理论视为“狂妄”。但正如多伊奇在书中明确指出的那样:

如果你没有事先预设的理论,你的观察就是没焦点的——你也得不到理论。

这就是批判性理性主义(Critical Rationalism)的出发点:知识不是从经验中“提取”出来的,而是源于猜想(conjecture)与反驳(refutation)的不断演化。我们不是先看到真理再理解世界,而是先提出解释结构,然后用经验去验证、质疑、调整。

多伊奇进一步继承并发展了波普尔的观点,提出著名命题:

“所有观察都是理论负载的”(All observation is theory-laden)。

换句话说:所谓“看见”,其实只是你能调用某种理论结构来解释当前感官输入。脱离结构框架的数据流,是纯粹的高熵噪声;而真正的观察,是结构的激活,是你大脑中一组“解释模型”与世界之间的匹配行为。

因此,经验主义的局限并不在于它错误地强调了“感知的重要性”,而在于它掩盖了解释先于经验、结构先于观察的认知真相。如果你从不猜测、不建构理论结构,你看再多的数据,也只是过目即忘的浮光掠影,永远无法通向知识。

不要等待经验的授权再提出结构,而是主动生成结构解释,再以反馈完善路径。

是呀,熵控术绝大部分理论一开始都是我根据计算的直觉猜的。猜错了就改正,猜对了就鼓掌,就这么简单。目前根据逐步完善的理论和论文,我还真猜对了很多啊。

忘掉老学究给你的一切思想钢印,他们自己也没做出什么成就来。从今天开始,just do it.


“主动生成结构解释,再以反馈完善路径”

这个怎么解决过拟合问题

生命体用具身反馈解决过拟合问题;LLM怎么办?

有道理啊:LLM如果要走出过拟合陷阱,必须从语言模型转化为行为体(Agent),进入具身世界,接受演化规则。

1/n

《无穷的开始》中最重要的思想之一,是对“可错性”(Fallibilism)的重新定义与哲学定位:不完美,不是缺陷,而是进步的前提。

可错性这一概念,最早由科学哲学家卡尔·波普尔系统提出。他指出:所有知识本质上都是暂时的、可被反驳的猜想。这一立场彻底挑战了传统认识论中对“确凿真理”的执着,强调真正重要的不是“确定”,而是结构的可批判性与可修正性。也就是说,知识的生命不在于它是否正确,而在于它是否能被挑战、被优化、被更新。

我进一步提出:任何的结构控制(熵控)本质上都是局部性的,并且在其建立之初,就已经内嵌了自我崩解的机制。一个结构的可调度性,恰恰来源于它对自身局限的开放性。我们不构建“完美结构”,而是构建可被修正的结构。一切结构,都必须为下一轮结构性演化留下通道。

这种理念,与东亚教育体系中根深蒂固的“真理崇拜”构成了鲜明对比。在那个体系中,做题家式的思维训练往往强调唯一正确答案,追求确定性,抗拒猜想、不容许犯错。这种“轴”的精神状态不是能力问题,而是由社会文化背景、生活结构、家庭闭合性共同催生的一种认知封闭系统。这种系统让人陷入一种错觉:好像世界就是一套标准答案,你只要找到那一套,就可以安身立命。但真实的世界远远不止于此。

现实中的系统,从来都不是封闭稳定的,而是不断变动、充满不确定性的。你会发现:

软件架构不是“找到完美结构”,而是不断根据场景迭代与演化;
科学理论不是“已知真理”,而是“更难被推翻的好解释”;
每一次系统崩溃、bug 弹出、异常行为出现,其实都是结构自我暴露缺陷的宝贵机会。

所以,真正有生命力的系统,一定能容纳错误、消化扰动,并将错误转化为演化燃料。一旦你构建了一个无法容错、无法调试的系统,它就会因为过度封闭而迅速死板、脆弱,最终走向解构。而如果你还固执地坚持这个系统、继续在错误路径上“深耕”,就会陷入结构性误判——错得越来越深,却自以为越来越接近“真理”。

从系统论视角看,这正是封闭系统的宿命。一个拒绝输入、不接纳反馈、不允许局部修正的系统,会不可避免地走向熵增极限。而开放系统则截然不同:它与外部环境持续交换能量、结构、信息,在不断扰动中实现自我重组与进化。

开放系统的核心特征包括:

可输入、可输出:结构是可修改、可重写的,而非静态的;
非平衡态维持:始终保持一定张力与波动性,使系统有机会突破当前稳定点;
自适应机制:能够感知偏差、接受扰动、修正路径,构建新的结构性秩序。

这也意味着:开放系统不是“稳定的”,而是“持续演化的”;不是“避免出错”,而是“用错误推动迭代”。

可错性和开放性在这里达成了根本性的协同关系:

可错性赋予系统内在演化的可能;
开放性则确保外部扰动能够进入系统,引发必要的结构重组。

如果将《无穷的开始》看作一部“反封闭认知哲学”的宣言,那么可错性就是它的开场白,开放系统则是它的执行机制。熵控术所要构建的,不是一个追求终极真理的封闭宇宙,而是一个持续结构压缩、路径演化与价值反馈的动态认知系统。

这套系统中,错误不是要被隐藏,而是要被调动;扰动不是风险,而是潜在的跃迁契机;结构不是永恒,而是可调、可迁、可崩解、可重组的智能单位。真正的智能,就是在错误中演化,在开放中生长。

2/n

科学即好解释:牛顿定律的典范意义

当我们问:“为什么苹果会从树上掉下来?”我们其实是在寻求一个对现实世界的解释。牛顿定律正是在这个背景下诞生的——它不是单纯为了拟合数据,而是为了提出一个关于世界如何运作的统一解释。从苹果下落,到行星轨道,它用极其简洁的形式揭示了隐藏在自然现象背后的规律。

与此同时,牛顿定律也展现了科学的另一个核心精神:可错性(fallibilism)。尽管它曾在几百年里被视为真理,但在进入强引力场(如黑洞)或高速接近光速的场景中,它的预测开始偏离观测,最终被爱因斯坦的广义相对论所修正。然而,这种“被取代”不是否定,而是对它适用范围的精确界定:它是一个在常规尺度内极其有效、但仍可能被改进的“临时真理”。正是因为它既深刻解释了现实,又能在新证据面前被修正,牛顿定律才成为科学精神的杰出典范。

Science is a good explanation.

这正是David Deutsch所强调的科学观:“科学即好解释”。在他看来,科学不是积累事实或寻找模式,而是提出那些难以随意更改(hard to vary)、每个细节都起关键作用的解释结构。一个“好解释”需要满足三个条件:首先,它的结构不能随意改动,否则就失去解释力;其次,它能排除其他替代解释,而不是说“也许如此”;最后,它具有预测力与结构耦合性,能推广到未见的新情况中去。这种标准解释了为什么历史上那些流传下来的科学理论——牛顿力学、达尔文进化论、麦克斯韦电磁学、相对论与量子力学——都具备强耦合、高不可变性和广泛的可达性(reach)。

过拟合与泛化

将这一理念延伸到现代机器学习,我们也可以清晰地看到,“好解释”与“拟合数据”的根本差异。在机器学习中,过拟合(overfitting)是一种典型的“拟合数据”:模型过于复杂,把训练集中的偶然波动当成规律,虽然在训练数据上表现良好,却在新样本上失败。相反,泛化(generalization)是模型“解释世界”的体现——它捕捉到数据中更本质、更普遍的结构,具备跨任务迁移和真实预测的能力。比如一个深度神经网络识别猫的能力,如果只是识别背景颜色或图片边框,那它只是记忆;但如果它识别出毛发、眼睛结构等普遍特征,那它就在“解释猫是什么”。

在评价一个模型是否具备“好解释”的品质时,我们可以借助两个强有力的工具:Kolmogorov复杂度与Rashomon集合。Kolmogorov复杂度衡量的是模型或解释的“最简描述长度”,也就是它是否能用最少的语言压缩最多的信息。一个“好解释”往往具有更强的压缩性。另一方面,Rashomon集合描述的是:在性能相近的情况下,是否存在大量结构完全不同的模型。如果你能找到成百上千个性能相当的模型,说明这个问题可能还没有被真正解释;反之,如果只有少数模型能达到顶尖表现,意味着解释空间受到了结构限制,也即达到了“hard to vary”的状态。

综上所述,牛顿定律不仅是人类认知史上的一次伟大飞跃,更是“好解释”与“可错性”相结合的科学范式。它展示了科学并不是靠数据驱动的统计堆积,而是通过压缩世界、揭示结构、保持开放的方式,不断逼近真理。这种理念,既塑造了物理学的黄金时代,也为人工智能、机器学习等新兴领域提供了持续演化的路径:不仅要预测得好,更要解释得深。

3/n

通用性(Universality):从计算原理到现实建构能力的逻辑链条

说实话,从“通用性”这个词开始,我就意识到自己有很多地方还不懂。David Deutsch 提出的“通用性”并不是一个抽象的理论标签,而是一条从计算出发、贯穿到物质建构与复杂系统模拟的深层逻辑链。对于像我这样刚接触复杂系统的人来说,理解这条链路并不容易,但如果我们按层次来梳理,它其实是非常具有结构感的。

逻辑的起点是“通用图灵机”。图灵机是一种抽象的计算模型,而通用图灵机的核心能力在于,它不仅可以执行一个固定的任务,还可以读取并模拟任意其他图灵机的行为。这意味着,只要你把“程序+输入”喂给它,它就可以模拟任何算法、解决任何可计算的问题。我们今天使用的电脑、手机、服务器,本质上就是这种原理的物理实现——一台通用图灵机的现实版本。这也是为什么我们只需要一台电脑,却可以运行无数种软件、游戏、程序的根本原因。

但更深刻的一点在于,“通用性”不是线性演化的结果,而是通过历史上的“结构突变”实现的。比如从“刻画数字”到“位值制”,人类实现了从有限表达到无限表达的飞跃;又比如从写死流程的代码,到通用编程语言的发明,使得程序本身可以动态生成和调用其他程序。这些“跃迁”不仅是功能增强,更是系统结构从封闭走向开放、从特化走向抽象的根本转变。Deutsch 把这类现象称为“Jump to Universality”——通用性的跃迁,背后靠的是对表达机制本身的再设计。

然而,能实现这种通用性并非所有系统都可以。通用系统必须具备“数字性”这一关键条件。所谓数字系统,是指它以离散状态构成,比如0和1,或者A、T、G、C这些碱基。离散的好处在于,可以清楚地区分、复制、纠错,而模拟系统(analog),如模拟电压或胶片光影,由于状态连续、误差不可控,复制几代之后就会失真。也正因此,像DNA这样的数字结构才能跨越亿万年持续地传递信息,成为生命复制的基础;而现代计算机也必须是基于二进制的数字系统,才能具备可靠运行与无限扩展的可能。

通用图灵机让我们可以模拟一切计算过程,但这还只是信息层面的通用性。更进一步的,是“通用构造器”的概念。这个词来源于冯·诺依曼和 David Deutsch,指的是一种机器,能够根据信息的指令,构建任何一个物理对象,只要符合自然法则,资源也足够。而现实中最接近这个概念的,其实就是我们人类自己:我们用知识、语言、工具,把原材料变成房屋、卫星、AI芯片……通用构造器的核心在于,它把“知识”变成“物质”的路径打通了——信息→物理结构成为可调度的闭环。这正是现代科技文明的本质。

最后一环,也是对通用性的最震撼诠释:复杂系统模拟的图灵完备性。图灵完备这个词听起来很抽象,但其实,它意味着即使一个系统只有极其简单的规则,比如康威的《生命游戏》,它依然能模拟任意复杂的计算过程。换句话说:只要空间够大、运行时间够长,简单规则+初始状态就能演化出不可预测、极度复杂的行为模式。这就解释了为什么我们可以用计算机来模拟天气、大脑、社会系统甚至宇宙——因为计算机本身就是图灵完备的,它可以承载和执行任意的规则体系。

总结来说,通用性从通用图灵机出发,穿过抽象跃迁、数字结构、物质构造,最终进入复杂系统模拟,构成了一条从信息到物质、从规则到智能的完整链条。这也是我慢慢意识到的:“计算”并不仅仅是算术,它是对现实世界建构能力的一种深层编码与模拟机制。而理解这条通用性路径,也许正是进入现代科学与智能系统世界的钥匙。

几个颠覆我的概念: 当我们谈“离散性”是通用性的关键时,很多人会感到困惑——包括我自己。一方面,我们生活中接触到的大多数事物,比如声音、光、温度、地形、身体、天气,几乎全都是连续的:没有清晰边界,也没有明确的“格子”。在这样一个连续的世界中,突然有人说,“离散结构(比如0和1)才是实现通用性的核心”?这听起来是违背直觉的。

但我们必须意识到一点:要想表达、计算、复制、传递并构造出一个系统的演化过程,信息本身必须具备明确的边界与可识别性。这就是“离散性”的作用。它让我们把一个无限模糊的世界,切割成“可以被操作”的单元。例如,把颜色分成像素,把语音变成字母,把连续电压变成0和1。正是因为这种离散化,我们才能“记录”世界、“计算”未来、“复制”规律。这也解释了为什么计算机是离散的、DNA是离散的、语言是由离散字母或词构成的。离散性不是对连续世界的背叛,而是理解与控制它的桥梁。

再说“康威生命游戏”,我承认这个例子一开始也让我很难理解。我们都知道细胞自动机可以产生各种图案,但怎么就“图灵完备”了?怎么就能“模拟一切”了?这听起来太夸张了。

关键在于,“图灵完备”并不要求一个系统表现得像现实中的大脑或宇宙,它只需要具备三种能力:

能表示任意的初始状态(信息存储);

能依据规则更新状态(信息处理);

能执行逻辑判断与跳转(控制结构)。

在《生命游戏》中,这三种能力理论上都能通过特定的细胞排列实现。科学家甚至用一块无限大的生命游戏网格,构建出了“门电路”“数据存储器”“指令执行器”——这些都是一台计算机运行所必需的部分。也就是说,虽然它只是黑白格子之间的“开”和“关”,但只要空间和时间足够,生命游戏就能执行任何计算——就像电脑一样,只不过是另一种表达方式。

所以,生命游戏告诉我们的并不是“它就像宇宙”,而是一个更深层次的事实:复杂与智能不需要复杂的起点,它们可以从极其简单的规则中“涌现”出来。

我也很懵。
4/n