摘要:当下人工智能的思维采用贝叶斯方法论,因此重新提出了经验论的问题。先验论对休谟因果问题的解决并不成功,贝叶斯方法另外给出了对休谟问题的经验论解决。休谟问题的核心是不确定的“未来”,人工智能将抽象的未来简化为可操作的“预测下一个标识”,在没有借助先验方法的条件下,成功地以贝叶斯方法去保证预测的有效性和可信度。这迫使我们去反思人类思维本身,重新思考经验论与先验论的经典难题。可以期待,如果发展一种属于经验论的动词逻辑,或可解释更多的思维秘密,也或可为人工智能增加一个分析和预测的维度。
关键词:人工智能 因果关系 未来 动词逻辑
作者赵汀阳,中国社会科学院大学哲学院教授(北京102488)。
来源:《中国社会科学》2024年第8期P101—P123
责任编辑:赵培杰
(一)人类反思的第一事件:逻辑学
人工智能只是最近一次迫使人类反思自己思维的事件。这里先以最粗略的线索来追溯人类反思自身思想的历史伏笔,以便更清楚地理解人工智能提出的思维问题。
原始人都是经验主义者,他们的生活经验足够维持生存所需,不需要反思。人类的反思意识是在思想开拓了经验无法解释的许多问题之后才发生的。思想反思自身需要特别的条件和机会。第一个条件是否定词的发明(详细分析参见我先前的论文)。否定词的发明是人类的第一次启蒙,也是人类意识的创世故事。否定词在存在论意义上开创了本来不存在的复数可能性(理论极限是无穷多可能性),使思想对象从单一的必然性维度升级为必然性+可能性的二维度,进而通过可能性又定义了偶然性,思想因此有了足够表达事态的三个维度。否定词使未来发生时间分叉,产生了“无穷”和“未来”两个在存在论上最重要的问题。如果没有无穷性和未来性,存在就根本不构成问题。无穷可能性使思想在获得自由的同时也陷入混乱,而不确定的未来性使人类产生了创造未来或预知未来的问题,这是意识产生反思的必要条件,但反思的发生还需要使问题激化的机会。
在武力足以解决生存竞争和利益分歧的远古时代,思想的反思不会发生,武力就是标准答案,不需要反思,只需要拼命,所以远古人类不会反思罪孽深重的战争,只去反思——实为忧思——生与死,因此产生宗教解释。在“前政治的”时代,人们尚未遇到思想自身陷入困境的问题,只在寻找必然性的道路上向外开拓。思想必须被自身的内在困局逼得无路可走才会去反思,这样的机会发生于古希腊的政治。
古希腊民主政治的核心装置是“广场制度”(agora)。自由言论的广场同时成为观点的自由市场,“寻找真理之地”(a place for logos)同时变成“主观意见之地”(a place of doxa)。据说那时人人以为自己掌握了“真正的logos”(类似真理的概念),意见之争促生了“修辞学”技巧,以诡辩、花言巧语、动之以情的手法去推销主观意见,于是思想乱了,无法辨明是非真假。苏格拉底和柏拉图开发了辩证法(与黑格尔式的辩证法不能合并同类项),所谓思想“助产术”,其核心技巧是:按照你承诺的概念、定义和道理去证明你自己的观点是错的,类似“以子之矛攻子之盾”。苏格拉底方法最早表现了思想的自反性(reflexivity),自反结构迫使思想自身变成思想的一个对象。先秦也有类似的机智发现,却止于机智,没有形成可操作的思想方法(modus operandi)。亚里士多德发明的逻辑学是辩证法运动的成就,用于克服修辞学和诡辩对思想的误导,为思想建立了通用标准和可操作的普遍方法,使推理成为数学式的必然算法。这是思想第一次为自身建立了思想规则。
(二)迫使人类反思的长事件:怀疑论
怀疑论是个长时段的反思事件,两千多年来不断釜底抽薪地质疑思想的各种基本假设。怀疑论或为唯一专属于哲学的方法(如果还有大概就是先验论证),其他方法或为通用的方法(逻辑)或为借来的方法(源于数学的分析、源于文本学的诠释以及源于历史学、人类学、心理学等的解释方法)。怀疑论的功能在于为思想建立自我反思的模型,几乎所有重大的哲学推进都始于怀疑论提出的问题。怀疑论也是古希腊产品。中国十分推崇“学”,没有发展出颠覆“学”的怀疑论。庄子以及公孙龙等略有怀疑论倾向,但更有价值的是老子的“反完美主义”,不是怀疑论,但有类怀疑论的效果,其洞见是不相信完美,也不相信完美是好事,反而认为完美不可为且有脆弱性,甚至是衰落乃至崩溃的临界点。以当代视角来看,老子的理论可理解为关于系统“鲁棒性”(robustness)的最早研究。鲁棒性是任何系统的生死指标,按照老子理论,余地是保有鲁棒性的关键条件。这是真知灼见,可惜没有发展为成熟理论。
话归正题。休谟提出了两个最深刻的怀疑论问题,一个是关于因果或预测未来,另一个是事实推不出价值。两个问题都触及人类知识和生活的基础,是最严重而难以逾越的难题,至今没有完美解法。接下来的讨论将限于休谟关于因果或未来的疑问,不涉及事实—价值的疑问。尽管两个疑问有着深层联系,但价值属于另一个维度,在此不论。
为了解决休谟问题,先验论做出了伟大的努力。“先验论”在此不仅包括哲学先验论,也包括逻辑和数学的公理化运动,以及其他先验设想,比如乔姆斯基语法等。最有价值的先验论是逻辑和数学的公理化运动,哲学先验论与之相比或有纸上谈兵之嫌,也不够严谨,但哲学先验论却是一切先验论的精神原则。这里以哲学先验论作为主要讨论对象,分析的预期是,如果先验论获得成功,就解决了休谟问题;如果先验论不能解决休谟问题,那么先验论就不是普遍有效的。
哲学先验论有两种代表性的路径。一种是康德理论,他的先验论证(transcendental argument,康德用词是“先验演绎”,即transcendental deduction)证明了:有一些思想结构(概念、形式和原理)与任何可能的思想是一致的,因此,那些思想结构必定内在地属于思想本身,思想别无选择地使用那些思想结构来对所有经验进行建构,任何经验都不可能逃逸,所以思想本身的内在结构就是先验的,并且对于经验普遍有效。假定意识别无选择地使用先验思想结构去思考任何事情,即使不能证明先验结构是最优的,但既然是唯一选项,对它的怀疑就无意义了。
缜密的康德方案却留下两个疑点:(1)经得住先验论证的考验的思想原则并不多,对于无限丰富的经验知识不够用,比如,康德的先验结构没有能力建立有效的因果模型,因此缺乏预测未来的能力,而这正是休谟问题的要害:如果知识只能“总结历史经验”,却不能因此推测未来,那就不是普遍必然的知识。休谟怀疑论的精华在于发现了一个恐怖的事实:在任何经验里都没有证据可以证明普遍必然的因果概念,简单地说,经验无法解释因果概念,因此,所有历史经验的总和也无法推知未来。(2)无法证明先验系统的唯一性。先验论证或可证明“某些”概念是别无选择的思想条件(这一点也是可疑的),但“某些”概念远不足以形成充分解释经验的先验系统,因此无法排除另外的思想系统的有效性。康德系统只能解释亚里士多德逻辑、欧几里得几何学和牛顿物理学那样的古典科学,却无法解释非欧几何、康托集合论、概率论、相对论、量子力学和生物学等现代科学,更不能解释当代复杂科学研究的“涌现”问题。这个事实证明,试图发现对所有经验具有普遍必然解释力的“唯一”先验系统是可疑的,思想的潜力或许无法探底。康德通过二律背反证明了人类理性的有限性,把“最难的”终极真理留给了上帝,可是康德却把先验系统想象为一个准神学的思想结构,以为人类有个唯一的先验系统能够无所遗漏、算无遗策地解释人类的所有经验,这是个微缩版本的准神学思想结构,然而人类知识的创造性和开放性已经证明,一锤定音的准神学思想结构是不可能的。
另一种先验论的代表是胡塞尔理论。对于胡塞尔,先天(a priori)结构也许有但莫须有,总之不是先验意识的要点。意识的根本意义在于意向性,在意识里没有优先于意向性的事情,没有意向,思想就不能发生。无论有没有先天结构,经验结构的形成都需要一个建构性的意向性过程,而意向活动就是建构的过程。关键是,严格属于意识本身的唯一资源是时间(内在时间),意识以时间性的意向活动(noesis)建构了空间性的意识对象(noema),或者说,意向活动是线性的时间过程,而意向建构的结果却是形成一个共时性结构的意识对象。以比喻来说,意向在线性时间中一步一步投射出去,重叠地落在同一个完成时上而构成一个完工的结构,就像一个完工的建筑。以时间性去建构空间性,这才是意识的先验本质。胡塞尔对内在时间的理解很优越,但现象学也有个局限性:对外部世界毫无说明,或者说,意识的现象学建构不能保证意识对真实行为、事物关系尤其是将要发生的未来的存在论建构。这意味着,现象学的时间是半截时间,止于现在进行时——意识的内在时间只有现在进行时一个时态——将来时的未来逃逸在外,不由意识做主,而未来才是忧患。
任何先验论都无法消除休谟的因果困惑或未来焦虑。未来作为意识的首要忧患,可以简化为“下一步会是什么”或“下一步怎么办”的迫在眉睫问题。无法预知的下一步的形而上实质就是未来性。休谟问题的厉害之处就在于以一个知识论的困惑击中了所有形而上学的一个共同弱点:无论何种形而上学宣称了何种永恒绝对或普遍必然或先验的原理,实际上却没有任何一个此类原理能够预知未来,无论世界还是行为的下一步永远都测不准,可见先验原理根本不是普遍必然的。可以说,永远逃逸的未来性才是哲学的根本问题。
在哲学对未来性一筹莫展的时候,人工智能大胆地显示了以经验方法去预测未来的粗鲁能力。相对于神秘复杂的人脑来说,人工智能的经验论方法很笨却又很管用,而且没有使用人类引以为豪的先验理性能力,这使人好奇人工智能是否大智若愚。人工智能的思维在哲学上形成一个必须反思的问题,应该说是经验论—先验论问题的回响:经验论思维与先验论思维何者更根本?如果先验论不足以指导经验知识,那么,经验论是否能够单独形成完整的经验知识?
(一)重提经验论和先验论的谜题
人工智能是否会成为一个心灵?紧接着的问题是:心灵是什么样的?前一个问题令人好奇,后一个问题击中哲学的痛点——我们至今还不太清楚心灵什么样。
人类为什么甘冒奇险非要创造人工智能,完全不符合风险规避的理性原则,这有些令人费解。不过,就当下的能力而言,人工智能距离真正的心灵还有很远的距离,还存在若干难以突破的技术极限。我在先前的文章里讨论过,只要人工智能仍然属于图灵机的概念,恐怕就很难发展出自反能力(reflexive),即对系统进行自我反思和自我改造的哥德尔式能力,还有理解概念和创造新概念的能力,理解并运用逻辑—数学的通用能力,以及回避不可解的悖论、矛盾与自相矛盾的变通能力(图灵机如果试图解决悖论,或死机或无法停机一直到死)。这里不复述这些瓶颈的细节,只想指出,以上这些理性能力都与先验论有关。也许未来的人工智能将兼备经验论和先验论的能力也未可知,但目前的人工智能只是经验论者,却显示出惊人的“思维”能力,这个挑战就非常有趣了。
人类有幸兼备经验论和先验论双重能力。先验论方法被认为表现了理性本身,因而被认为是更高级的。但两件事情力挺起经验论,一件是经久不衰的休谟问题,这对于先验论几乎是生死挑战;另一件是人工智能以经验论方法取得的成功,这迫使人们必须再次反思意识和思维的秘密。
(二)再以康德为例
康德为经验知识设想了一套令人神往的“先验软件”,即意识内在自带的先验系统,包括逻辑、先验范畴和先验时空。应该还包括数学原理,但康德不会像罗素那样激进地认为数学能够还原为逻辑,证据是,康德相信数学命题属于“先天综合判断”,也就不可能还原为只不过是“重言式”的逻辑了。先验系统的普遍有效性不能空口无凭,终究要落实为应用于所有经验的必然有效性,这一点却没有经验作证,不可能在经验中被证明。“所有经验”是个恐怖的全称概念,人类没有能力遍历无穷多经验或无穷多可能世界,于是不得已,先验系统只好自己证明自己,即所谓“先验论证”(先验演绎)。可惜先验论证自身有个先验的局限性:先验论证的最大限度能力只够证明思维自身有个内在的先验系统,假定是康德系统K,并且先验系统K是思维的唯一系统,别无选择,因此思维只能使用K去解释所有经验。换句话说,先验论证至多用来证明某个思维系统是思想别无选择的唯一先验系统,但不能证明这个先验系统的普遍必然性。其实这个唯一性大有疑问,如前所述,后康德时代的科学比如非欧几何、康托集合论、概率论、相对论和量子力学都不符合康德想象的先验系统,当代的复杂科学就更加不符合康德系统。从知识事实去反推生成事实的条件,即可证明康德系统并非唯一选项。
思维到底需要多少思想系统,目前还不知道。权且假定思维就只有一个先验系统,给定的就是康德系统K,并且假定系统K是自身一致的(consistent),即系统自身无矛盾,那么,系统K还必须自证其完备性(completeness)。这里无法回避的困难是,尽管思维可以只使用系统K去解释所有经验,却难以证明思维在经验应用上总能够正确地使用系统K,或者说,对于无穷万变的经验实例,系统K何以一贯正确地保证自身的运用?系统K如何知道,对于每一个经验实例,应该分别使用哪些逻辑规则、哪些先验范畴去把感性材料建构为可理解的对象?或者说,面对杂乱无章的“与料”(the given data),系统K何以知道,又如何指引自身去建立何种组合和结构?啰唆地说,系统K何以事先知道——即先验地知道——在无序的“与料”之中,应该选出哪些材料来组成思想需要的组合,应该使用哪些范畴、概念和结构去把哪些感性材料建构为某个事物?简单地说,先验系统凭什么能够正确地自己指导自己?明白地说,思维主体在把先验系统K应用到经验上的时候,凭什么知道哪些色彩、质感、形态、形状、味道、温度、速度、力量等感觉材料非要以如此这般的方式(而不是别的方式)组合在一起,来形成具有如此这般结构的某种事物(而不是别的)?比如,意识凭什么知道如此这般的感性材料应该组成一棵树或一条鱼,为什么不会把那些“应该”组成一棵树或一条鱼的感觉材料错误地组合成一块石头或一匹马?这不是笑话,而是先验系统必须自我解释而难以解释的难题。
这个问题对于先验论是个真正的挑战,等于要求意识自己解释自己真的“总是”能够正确地指导自己。维特根斯坦说过一个同构的笑话:有个人把手放在自己头顶来证明“自己有这么高”。要证明意识能够正确地指导自己,比意识去自证只使用某个先验系统要难得多。如我们所知,康德通过先验论证(先验演绎)解释了后一个问题,但“意识总能够正确地运用自身”或“总能正确指导自己去组装感觉材料而形成有效的知识对象”就没有那么容易证明了。有点悲惨的是,先验论证的绝技对此却派不上用场了,于是康德另外发明了一系列奇妙概念试图解释意识的正确组装能力,包括先验想象力、先验统觉、先验亲和力和先验图式(scheme)。但这些奇奇怪怪的概念并没有回答上述难题,似乎只是重复了问题。为什么意识能够正确地组装感觉材料?是啊是啊,因为意识的神秘能力能够正确组装感觉材料。比如因果关系,休谟指出,我们并没有看见因果关系,只看见先后关联。康德对这种简陋解释很不满意,然而康德把因果关系定义为先验范畴并无助于解释因果性,显然难以说明意识如何知道因果范畴在什么时候可以把哪些经验解释为因果关系。“先后关联”虽是隔靴挠痒,但至少是因果性的一个看得见的投影。
究其深层难处,就在于先验系统只能保证仅限于形式系统的必然有效性,但不能保证在无穷经验中的普遍有效性。一句话,除了幻想的上帝全知,没有一个思想系统能够彻底认识无穷性。理性为自身设立的先验系统即使是一致的,也不足以解释经验,这意味着,思想系统在形式上的一致性无法保证实质上的完备性(哥德尔定理证明了这一点),只要涉及经验的实质内容,先验系统就失去普遍有效性或预计的“先验效率”(transcendental efficiency)。因此,不存在能够解释所有经验实质关系的先验系统。
正如康德自己意识到的,形式的先验系统不足以先验地指导对经验知识的实质建构,因此,必须增加一些保证先验系统正确使用自身的指引功能,即能够把形式化的范畴和原则与经验细节缝合对齐的转换功能——给个不准确但容易理解的比喻,就像用电需要“转换器”,先验想象力、先验统觉、先验亲和力和先验图式就是从先验到经验的转换器。可是没有人(包括康德自己)真的知道那些转换功能是什么样的以及如何运作。假定真的存在一些从先验到经验的转换规则,那一定不是先验原理,否则经验知识就会具有数学般的必然性和可信性。事实证明,经验知识并不可靠,永远处于修正之中。这说明,即使存在着从先验到经验的转换规则,也肯定不是先验规则,只能是人设的“规范”(normative)原则。
这正是个疑点。在知识论里,在先验系统与经验知识之间,插入人设的规范,显然是不协调的——休谟论证了知识与规范不可兑换。即使真有心同此理的心理规范,也不可能被证明为必然的。只有形式规律(逻辑和数学)或自然规律(科学定理)才可能是必然的。规范无非是“立规矩”,或伦理或美学,或是“语法性的”,都不可能被证明为普遍必然的原则。“人人都如此”的错误率高过正确率。在某种视觉设计的误导下,人人都会把两段不同长度的线段看成同样长度;或如格式塔理论说明的,人人都倾向于把有缺口的圆“完形地”看成真的圆。诸如此类。先验想象力、先验统觉、先验亲和力和先验图式大概是心理定式,而许多心理定式是幻觉。热爱数学和逻辑的康德估计也是不得已才引入心理概念,可是心理概念至今仍是不清楚的意识黑洞,康德也只能语焉不详。还有另一种可能性,也许可把先验想象力、先验统觉、先验亲和力和先验图式理解为类似“语法”的模式。这种理解好过心理主义,但仍然不是先验的。以语言的语法来作类比,在一种语言里,形容词在名词后面,在另一种语言里,形容词在名词前面,甚至有的语言并没有严格的主谓语法(例如中文),但各种不同的语法都是合理的。由此看来,无论先验想象力、先验统觉、先验亲和力和先验图式是心理定式还是语法模式,都不是先验的,加以“先验”的形容词应该是搞错了,其实就是经验性的。结论是,意识确实有着某些先验形式,但不足以充分解释经验知识,那么,经验能够解释自身吗?我们通常觉得也不能,但人工智能似乎想说能。
(三)所有问题都是关于“下一步”
有个令人吃惊的事实(或只是令我吃惊),人类只在需要复杂思考的时候才使用数学和逻辑,而“复杂时刻”并不多,在日常生活的绝大多数时候,人人都是经验论者,所以令人吃惊是因为,经验思维居然有效地应付了绝大多数的情况。有趣的是,无独有偶,当下的人工智能暂时还缺乏主动使用逻辑—数学的能力,无论是ChatGPT还是Sora,在思维上都是经验论者,其方法论上与我们的日常思维很相似,尽管思维的“用料”有所不同。
人工智能的思维材料是“标识”(token,也译为“标签”或“词元”),而人类的思维材料是语言和意象,但人工智能和人类日常思维都使用经验论方法。由于人工智能的思维材料是本身不含知识或语义解码的标识(类似于密码),因此产生了在人类思维中所无的一种特殊效果。人工智能科学家陈小平认为,这意味着在人类的抽象思维和形象思维之外的第三种思维,他称之为“志象思维”,是基于大数据分析的“关联度预测”能力。“志象”概念似乎有些拗口,不如直呼其名,称为“标识思维”。学会与人对话的人工智能事实上学到的不是有着人文和知识意义负荷的语言,而是由无数关联性或无穷可能链接构成的标识系统。语言和标识系统是同一事物的不同呈现,类似于声音和声波,但人工智能把语言的所有元素一视同仁地识别为标识,相当于收到“声波”却没有转换为“声音”,没有将语素识别为语言里的词汇和语法,连“语言”这个概念对于人工智能也是个标识而已。
似乎可以这样理解语言(未必正确,有待讨论):只有当一个标识系统内含地自带解码自身的自反能力,这个标识系统才同时成为语言,否则只是一个符号系统(所以动物“语言”只是符号系统)。这意味着,语言必须是一个自身内在具有先验自反性(transcendental reflexivity)的系统,以至于语言里的所有语素,包括每个词汇、语法和所有语词关系的意义和功能,都能够在这种语言系统内部被反思地解释(解码),即一种语言必须能够自己解释自己的所有组成元素,必须能够自己解说(讲解)它所包含的每个词汇和每句话的意义。假如一种语言的自反能力足够强大,就不只是解释,甚至能够定义它所包含的每个词汇及其关系,就像数学系统。定义是封闭性的即最强的解释,如果对词汇及其关系的解释强度达到歧义为零的封闭性,就形成严格定义。自然语言不可能也不需要对词汇作出如此严格的定义,自然语言里的“定义”几乎都是不合格的,只是“种加属差”的定位(类似GPS的定位)加上一组构成识别度的性质描述,并非封闭定义。为了保护丰富性,自然语言必须牺牲严格性,丰富性比严格性更重要,因为自然语言需要表达无限丰富而混乱的世界和生活。总之,语言对自身系统内所有事情的反思—解释能力等价于思维对自身的反思能力,两者是映射关系。正因为语言有着解释自身所有元素的反思能力,所以人类才形成了思维能力。
自然语言里会不断出现来自生活的新奇词汇,于是语言有“先验义务”去解释所有奇怪词汇。假如某些词汇终究无法解释,就必须考虑两种可能性:(1)或者这种语言不是一种成熟语言,反思能力不足,无法将某些词汇转换为一组可识别的描述;(2)或者那些词汇本身不合理,根本无法转换为任何描述,也就无法被解释。无法转换为描述的词汇不能产生思想,是语言里的废品。比如那些试图概括万物的终极真理或人生至高境界却不明其意的词汇就不是语言里的合格词汇,貌似深不可测,实为语言的幻觉。凡是听不懂的,并且不是费脑的数学,那一定是语言幻觉。
根据以上分析,一种合格的语言必定具有反思自身系统的先验自反能力,因此,语言即反思。由此可知,具有能够反思自身的自反能力的标识系统才成为语言,如果一个标识系统不具有自反性,就尚未成为一种语言,它的元素就仅仅是标识,与路标或商标相似,不能生成概念,也就不足以产生思想。
人工智能学会的就是标识系统,不是语言。人工智能有能力发现标识之间的最大可能关联性而建立标识之间的大概率链接,因此貌似在言说。人工智能输出的标识链接在人类眼里是语句,但人工智能并不理解其中的含义,它理解的是标识关联的可能性和概率,而标识承载的知识—思想含义属于外源性的资源,即属于人类的语言和知识。这意味着,人类语言是人工智能的标识系统的字典、索引或注解,人工智能的标识相当于它自己不明其意的密码,而人类语言是解码底本,相当于人工智能掌握了如何发送密码,而尚未掌握解密能力。虽然人工智能不是在“胡说”,但只是在“学说”(有时人们指控人工智能“一本正经地胡说”,其实真不是胡说,只是数据和训练不足)。这说明人工智能尚未掌握具有自反性能力的语言,尚无反思能力。反思是思的必要条件,所以人工智能仍然处于“学而不思”状态。换句话说,人工智能的“思维”仅限于处理数据,只在它自己不懂的大量标识之间按照最大可能的关联性来建立最优组合,然后输出给人类,而人类有“密码本”,所以人类读到了知识和思想。
在此的挑战性问题是,人工智能仅仅通过寻找数据的关联性,为什么能够形成相当于知识和思想的效果?知识和思想如此复杂,人类自己也需要苦苦学习,还经常学不会,人工智能是如何“搞定”知识和思想的复杂性的?谜底既惊人又令人失望,对于人工智能,所有信息无论多么复杂都是同质的标识,于是,任何复杂的意义都可以简化为标识的链接,这极其有趣地意味着,所有问题,无论多么复杂,都被转换为一个简单的问题:如何预测下一个标识(next token prediction),即对标识之间关联度的预测。如此化繁为简,堪称天才。在哲学上说,其天才之处在于把无比复杂而令人无措的“未来性”问题简化为有法可行的“下一步”预测。对于不确定的未来,人经常有想法但没有办法。人工智能把抽象的“未来”化为具体的“下一步”就有了办法。
人工智能化繁为简的策略之所以成功,在于关联度的预测方式虽然简单,却反映了经验论方法的精华,即贝叶斯概率(包括与贝叶斯相似的思想或基于贝叶斯思想的改进版)。如果说休谟提出了最深刻的经验论问题,那么或可以说,贝叶斯方法是对休谟问题的相对最优解法,胜过康德的先验解释。必须承认,休谟问题不存在绝对最优解——除非是上帝的全知思维。先验论虽然显示了高超的思想,却文不对题,因而没有解决休谟问题。假如休谟面见康德,可能会说,您并不是我的破壁人——问题的要点不在于意识是否有组织经验的先验能力,而在于,即使意识有着组织经验的先验能力,仍然不能事先地或先验地获得关于未来的知识。“未来”永远是个谜,所以未来才是问题之所在。
(四)未来就是赌注
抽象思维的崇高地位来自逻辑和数学的成功,以及声名有点可疑的哲学,但实际上,人类的生存和生活更多使用的是经验思维。经验知识的主要生成方式是处理数据的概率论。就目前而言,人工智能处理大数据也是借助经验主义的概率论,还没有学会通用的抽象思维。
概率论的实质是信息压缩(compress),把充满“噪音”的杂乱数据压缩为可理解又有足够解释力的模型。以概率去压缩数据,其“保真性”是件有争议的事情。假如数据是个有限且可枚举的封闭集合,概率就等价于信息无损的完全归纳了,可惜大多数情况并非如此,而是不确定、不稳定、非封闭的无穷变化状态。只能退而求其次,在损失无关紧要信息的基础上去建立足够有效的解释模型,总之是把不能直接理解的经验数据压缩为可理解的模型。康德想象的对知识对象的建构大概就相当于建模——这个说法没有征求康德的意见。如果有什么区别的话,康德的猜想是心理学式的,但至今无从知道先验想象力或先验统觉如何运作,而人工智能的建模却有实在可操作的经验主义方法论。
必须来讨论挥之不去的关键问题,即“未来”。人类需要处理的绝大多数事情都是“未来”(偶尔怀旧),可是未来是人类力所难及的根本问题。哲学干脆去想象一些使未来黯然失色的最大极限概念,比如“永恒”“终极”“绝对存在”之类,但那些极限概念并不是思想的对象,而是信仰的对象,因为无从思考。那些极限概念的所指超越了时空,是无限性本身,人类没有能力去遍历无穷多的所有可能世界,所以不可能认识无限性本身。德尔图良所谓“唯不可思议(absurdum,也译作‘荒谬’)可信之”的深意在此,无限性超出了思维能力,所以不可思议或荒谬,只能是信仰的对象。形而上学把一系列极限概念(无限性=永恒=完满=超越=绝对存在)看成思想对象,那是知识论谬误(康德已给出证明)。人类能够思考的最大概念是时间,而时间的意义在于后继性,也就是未来,如果没有未来,现实连同历史都失去意义,所以如果不考虑未来,就没有必须反思的事情了。要求“活在当下”的“当下主义”(presentism,弗朗索瓦·阿赫托戈(Francois Hartog)提出的概念)是一个存在论谬误。当下时刻是个趋于无穷小的点,没有足够形成意义的尺度,“活在当下”只能意味着意义瞬间消散。每个当下的意义都在于未来,即下一步,以及下一步的下一步。重复一遍:未来是时间的意义。
未来问题的实质在于求解“不可能预定的最可能未来”。不难看出,这是风险性的“赌注”。生活就是冒险,即必须在不确定的复数可能性(理论上是无穷多可能性)之中作出选择。成王败寇、兴衰荣辱、运筹帷幄、功败垂成、天赐良机、时来运转之类,都在讲述风险赌注的故事。风险选择都是“赌博性”,但我们不关心赌场里的投机游戏。风险赌注是个严肃的存在论概念,其极端形式就事关“存在还是不存在”(to be or not to be),在知识论上也称为或然决策。只有全知才能作出确保为真或确保最优的必然选择,人没有此种能力,因此,即使在高概率的知识加持下,选择一种未来也仍然是“赌博性的”或然决策,按照贝叶斯的说法,只是在研究“机会”。如果嫌弃“机会”概念有点唯利是图的味道,也可换成装腔作势的“命运”概念。休谟问题的要点是“未来”,选择未来就是冒险,人们一直奢望能够发现必然赢的下注方式。
休谟问题可以有多种角度的理解和表述,但根本意义相同,比如可以表述为:根据所有以往经验不可能必然推出未来;或另一种表述:在有限的所有经验里不可能确认必然的因果关系。被“惊醒”的康德试图以先验论去拯救对于知识不可或缺的因果概念,但如前分析,即使先验论证可以证明因果概念是不可或缺的先验范畴,也不可能保证产生必然的因果知识。几乎没有任何一个先验范畴能够被证明对于所有可能世界为真,因此,即使先验论为真,也不足以建立普遍必然的经验知识,简单地说,先验论也对付不了无穷性。与康德试图以先验论去解决休谟问题不同,贝叶斯给出了一个经验论的解决方案,尽管只是近似解决。经验论只求赢面较大的赌博,贝叶斯概率就是相对最优的解决,但对未来的正确选择不是能够一次性完成的,而是在不断选择未来的过程中慢慢涌现出来。
在发现贝叶斯概率之前,人类仅凭直观而不知不觉地采用贝叶斯方法论去生产经验知识,大模型人工智能也采用贝叶斯方法论,这暗示了,至今还没有发现比贝叶斯概率论更好的方法去选择一个相对可信的未来。值得一提的是,除了需要科学分析和数学运算的事情,人类在日常生活里几乎每天使用的只是能够节约大量思考时间的“模糊版”贝叶斯方法,差不多接近于直观推测,几乎不算是运算,至多有点大略心算,因此错误率比较高,以至于长期以来忽视了贝叶斯方法的巨大能量。人工智能的神经网络运算功能强大,不怕数不胜数的数据,能够把贝叶斯经验主义方法的能力发挥到极致。
在ChatGPT运行测试版时,我做了一个猜测:估计贝叶斯方法论是其核心技术。后来看到业界的许多类似分析,说明大概是猜对了。我没有人工智能的专业知识,而是根据日常直观的反推理,类似侦探的反推理:首先已知ChatGPT仍然属于图灵机,那么尚未具备自我反思能力;并且,ChatGPT能够经常输出有效语句,那么,要处理“无穷多的”标识,在图灵机能够运作的方法中,最有助于选中合理后继标识的方法论是贝叶斯方法,那么,它最有可能使用了贝叶斯方法。这个“侦探式”推论,类似于皮尔士的“溯因推理”(abduction),即从事实反推可能原因的方法。皮尔士推理与贝叶斯推理的运行方向相反,但其中道理相通,甚至是互补的,类似几何的补角,或约等于逆运算,我愿意相信,两者能够互推。
贝叶斯方法只是经验论方法的基本精神,现代数学家们发展了具有贝叶斯精神的更复杂更先进的方法和算法,最终形成了大模型人工智能算法,其基本原理是“后继标识预测”(next token prediction)的算法。自从贝叶斯以来,皮尔士、所罗门诺夫、柯尔莫哥洛夫以及当代许多数学家和科学家(名单太长),也包括经济学家海耶克和哲学家波普尔等,似乎不约而同地反思了同一个问题,并从不同角度所见略同地发现了经验论中最基本也最有效的思维方法:把经验知识理解为一个无穷开放的演化过程,即不断以新经验去修正旧知识的无穷迭代过程,按照贝叶斯的概念来说,就是不断以“后验概率”去修正“先验概率”的无穷过程。这种经验论方法的巧妙之处在于,既然人类没有遍历无穷多可能世界的全知能力,也没有对无穷经验普遍必然有效的先验知识,那么,以一种无穷性(认知的无穷迭代过程)去应对另一种无穷性(世界的无穷可能性)就是最优方法。尽管两种无穷性的规模并不完全对等,世界的无穷性永远大于认知的无穷性,但在康托集合论的意义上,认知过程的“无穷之势”将映射地无穷地逼近世界的无穷性。
这里要澄清一个误导性的翻译。把贝叶斯方法里的prior probability译为“先验概率”是不准确的,其实完全不是先验论意义上的a priori,只是预先的主观判断,应译为“预设概率”或“先估概率”。与之对应的“后验概率”(posterior probability)则是正确译法。贝叶斯方法的意思是,即使在完全无知的情况下,人也可以对不确定的未来给出一个预先估计,即预设概率。当然,预设概率多半不准确(碰巧猜对的情况少之又少),然后再根据新经验去修正判断,是一个不断以“后验概率”去修正“预设概率”的无限过程,于是有贝叶斯方法的基本公式或最简练版本:P(A|B)=P(B|A)*P(A)/P(B)。其中要点是,新获得的后验概率同时就变成了预估下一步的预设概率,可见预设概率不是“先验的”。
贝叶斯方法论或蕴含如此的哲学理解:(1)经验知识的有效性在于此种知识对于未来的有效性,因此,经验知识的核心问题是未来,即试图知道那不可能确知的未来。其实,不仅知识而且任何作品的意义,甚至是任何存在的意义,都在于未来。(2)未来是无限开放的概念,意味着无穷多可能性。未来性是时间的本质,而时间只是现象(作为现象的时间由具体运动来定义),未来才是真正的形而上学概念。未来无法定义也无法直接测量,由不确定而全然无知的无穷可能性所构成,在这个意义上,未来是真正超越的,是知识的绝对界限,所以不存在一种能够确保普遍必然性的先验知识,同时,未来也是经验知识不可消除的永远问题。(3)建构经验知识是无限连续的过程,意味着关于世界的真理不可能有一个定论。除非给定一个可量化的预定目标,定义了某种经验真理的完成度和满意度,否则经验真理永不止步。与经验真理相关,一般认为波普尔的“可证伪性”优于“可证实性”的传统概念。这或许是个误解,可证实性是相对于特定可完成的有限目标,而可证伪性相对于无限过程,两者不矛盾。其实,可证伪性的概念也不太准确。既然经验知识永远不可能被完全证实,同理,也不可能被完全证伪,经验知识的准确性或“似真度”只是永远不充分而已。可证实性或可证伪性此类“定性概念”都属于古典哲学遗风。以经验知识的性质而言,恐怕只能说经验知识具有不同程度的有效性。“有效性”是一个在概率上可衡量的概念。(4)经验知识的无限修正过程表现为相关可能性的无限收敛过程,即由无穷多可能性不断收敛为逼近必然性的不可完成过程,类似于圆周率不可能算完。其中,可能性的收敛度与经验知识的有效性成正比。
经验知识看起来平平无奇,不如先验知识那么完美,但正是经验知识构成了人类生活和思维的基本运作,决定了人类如何选择未来。人类替人工智能选择了贝叶斯—所罗门诺夫方法,显然,人类把自己掌握的最好的经验论方法赋予了人工智能。此种方法并非在绝对意义上是最好的(绝对最好的方法应该是人们幻想的上帝全知方法,即不费任何时间就能够遍历无穷多可能世界的方法,但这完全是幻想),只是说,没有更好的,就算是“最好的”。假如外星人看见人类或人工智能使用如此笨拙的方法,或许笑掉大牙。必须承认,就工作方式而言,经验论的方法是很笨的。大多数人在日常生活中使用的经验论方法只是与贝叶斯方法粗略相似的思维,是“下一步预测”的模糊版,似乎比人工智能还要笨,然而很有效,而且不需要大数据,也不需要精确分析,就是说,与人工智能相比,人类经验论思维的“成本”要低很多,而效率却不低。这个人脑奇迹提示,人类思维还隐藏着不少有待破解的秘密。就已知能力而言,人的思维在关键时候还使用了先验论方法,即通用的逻辑和数学,这是人类思维如虎添翼的其中一个原因,也是人工智能暂时还不会的技能。
(五)回到先验论问题
为什么不让人工智能学会通用的逻辑和数学?科学家们当然想,但事情有点复杂,目前似乎有技术上的限制。已有的人工智能只能运行物理方式上可实现的程序,因此不可能突破图灵机的概念。人脑是生物系统,物理与生物的差异很可能就是答案。或许将来的人工智能会在物理性能上取得巨大突破,以至于获得与生物系统等价或更强的能力,或发生更惊人的突破,比如创造出物理和生物一体化的人工智能,皆未可知。但在图灵机概念下,受制于物理上可运行的程序,处理大数据的最优思维方法就只能限于经验论方法。
人工智能不识字,只是使用贝叶斯方法去猜测下一个标识,但其强大的运算能力以勤补拙,甚至以勤胜巧,居然以“文盲”的方式找到了语词间大部分的正确相关性,在客观效果上等于说出了正确的语言和文本,甚至“算对”部分数学题(取决于数学的标识和关联性是否有足够的确定性和限制性),那么,随着人工智能运算能力的增强以及大数据的“无限”增量发生,人工智能是否终将能够以单纯的经验论方法产生出等价于人类基于经验论方法+先验论方法的知识?以俗话来说,“一招鲜”是否真的能够“吃遍天”?如果答案是肯定的,那么人工智能在图灵机的概念里也有希望成长为不输于人类的超级人工智能;如果答案是否定的,人工智能就必须突破图灵机的概念。上述问题也可以转换为哲学问题:经验论思维的“算力”是否能够进化到几乎等价于抽象思维的普遍化能力?明白地说,经验论的极限能力是否趋近先验论的能力?是否存在此种思维奇点?
如果以贝叶斯方法来定义经验论的能力,那么,知识的增长与经验的增长是同步的。这种经验知识的增长方式因其单纯而很笨,“吃一堑长一智”意味着“吃一堑只长一智”,并不能产生“举一反三”的知识推广增长。但需要注意的是,严格对齐经验的经验论不是归纳主义,而是永无定论、步步演进的贝叶斯概率论。归纳主义是对经验论的误解。罗素发明了一个具有休谟精神的讥讽性的“归纳主义火鸡”寓言,即火鸡根据“自古以来”每天都有人来喂食的经验,得出一个归纳主义结论:将来的每一天也有人来喂食,但事与愿违,它很快就被杀掉做成食物了。这个故事说明,除非面对的是一个封闭的可枚举的有限集合,并且遍历了所有可能情况而形成完全归纳,否则不可能通过归纳而获得普遍必然的结论。举一反三的推广法并不是经验论方法,反而是基于“世界齐一性”的先验论假设的递归算法。假定真有某个原理在无穷可能性里递归有效,这个原理肯定不是从经验推导出来的,而是“先验的”。
根据先验知识的伟大成就,尤其是逻辑和数学,无论如何也不可能反对先验论。但我们总是不得不回到先验论本身承载的一个顽固疑点:即使先验原理在先验系统内是普遍必然的,也不能保证其经验应用是普遍必然的。明白地说,“先天为真”(a priori)不能保证“先验为真”(transcendental),因为原理管不住实践。这大概等价于前面讨论到的康德难题,康德为了保证先验原理在经验里的普遍有效应用而假设了无法证明的先验想象力、先验统觉、先验亲和力和先验图式——奥卡姆肯定不会同意增加这些无法证明又解释不清的项目。先验想象力和先验统觉过于神秘而费解,但先验亲和力和先验图式在今天却有望在经验论里得到解释(这不符合康德的想象)。如果删掉定语“先验”,亲和力在效果上就有些接近于人工智能在数据中发现的关联性(例如ChatGPT预测的后继标识关联性);图式则或略接近于人工智能试图建构的“世界模型”(例如Sora的拟真情景建构),不过人工智能的世界模型尚未成熟。这似乎说明,康德设想的那些先验心理学概念其实应该由经验论来解释,康德可能挑错了那些概念的发生地,错误地命名为“先验的”。
18—19世纪哲学家们推想的先验系统在当时很有说服力,是因为与亚里士多德逻辑学、欧几里得几何学、古典数学和牛顿物理学高度互证,但与后来的包括非欧几何、康托集合论、概率论、哥德尔定理、相对论、量子力学、生物学以及更新的复杂科学在内的当代科学却不吻合。既然先验系统的设想有可能出错,那么就意味着,对先验系统的设想方式是经验的。无论如何,先验论的思路有着重大价值,似乎有两种或可提高先验论“安全度”的改造路径。
一种办法是把先验系统约束为“贫乏的先验系统”,即以奥卡姆态度把思维所需的先验原则减少到不可减省的数量,剩下“久经考验”的先验原则就应该是安全而普遍有效的。例如康德的先验范畴里有不少可疑的范畴,与其说是思维的普遍范畴,不如说是欧洲语言的特殊语法现象(我曾有过分析,在此不复述);又如乔姆斯基的先验语法,恐怕不是人类语言的普遍结构,比如中文语法就未必能够还原为乔姆斯基语法。发现疑点不难,难的是认定到底哪些先验原则是不可减省的。通常相信,最保守地说,逻辑的基本概念和基本规律必定是先验的,甚至满足莱布尼兹的最高标准,即对于“所有可能世界”为真。但看来是一厢情愿了,首先排中律最为可疑,不能无条件使用,必须有限制条件才能使用(只有在矛盾律生效的范围内,排中律才是有效的);矛盾律的有效性又仅限于命题关系或真值关系,在其他事物上就非常可疑,比如人类至今还不能确定什么是好什么是坏,更不能确定好坏是矛盾的。可见排中律和矛盾律都不能用于解释真实世界,也不能用于价值问题,只能解释思维本身的形式关系;甚至最坚固的同一律在某些可能时空(比如五维时空)中也变得含糊。同一律的有效性基于个体、实体、本质等一系列形而上学假设,可是这些假设只属于思维而不属于经验世界或量子世界。显然,很难确保哪些先验概念或原则在任何意义上或对于所有可能世界为真。在任何意义上无条件为真的先验原则是属于上帝的神学假设,所以,即使以“贫乏”为代价去简化先验系统,恐怕也难以捍卫通用先验论。
另一种现实主义的可能路径是给先验论增加存在论的限制条件,或者说某种特定的“存在论承诺”,使通用先验论收缩为特定的“收敛的先验论”。包括我自己在内,很多人都不愿意放弃通用先验论,我们太喜欢能够给出普遍必然答案的先验论了,但在事实面前,通用先验论不得不让步。所谓“收敛的先验论”就是承认经验论是先验论的应用生效条件,或者说,经验论是先验论的存在论约束条件。收敛到什么程度?比较可靠的尺度应该是“某个可能世界”,相当于莱布尼兹真理标准的第二级别,即至少对于某个可能世界必然为真。即使把先验真理限制在某个可能世界,仍然不算谦虚,如果那个可能世界是足够丰富的,那么它包含的可能性也无穷多,未来仍然无限分叉,比如人类生活,因此仍然难以确认对于某个可能世界哪些原则是先验而普遍必然的。
人类对思维自身的反思远远没有探底,很可能还有未被发现的秘密。自反性的反思有着自相关或自我纠缠的难处,而人工智能可以成为侦探人类思维潜力的一个“镜像式的”实验场地。当然,人类也没有别的可用镜像。
(一)如果选取的思想对象不是名词而是动词
先验论和经验论两种能力是如何协同合作的,即先验与经验的配对,尚不很清楚。要克服这个康德难题就需要深入一个未被充分反思的思维死角。未被反思甚至不乐意去反思的思维死角一般都是支撑“所有观念”的形而上学预设。只有决心对形而上学预设进行死无所恋的反思,才会发现那些看起来很美的形而上学预设并没有那么理所当然。这里我只反思其中一个形而上学预设:名词主导的思维,或以名词为本的思维,简称名词思维。思想的对象是名词,甚至反过来,名词都是思想的对象,这是一个从未加以论证但普遍默认的假设,很可能与语言的语法有关。名词作为主语来引导句子,最终又落在宾语上(还是名词),于是名词就似乎在主导思想。但实际上,严格地说,名词都是虚构,不仅主观地定义了(定义即虚构)各种独立存在、内在有着不可替换也不可改变的“本质”的事物,进而以名词的分类学和语法关系去描述世界。天地不言,无法自辩,万物自己从来没有把万变的事态限定为不变的事物,真实存在只有连续变化的运作和过程,不会停下来成为固定的名词。基于名词关系的名词思维建立了以为是“先验”的万物秩序,其实与真实的存在状态有着很大差距。从相对论、量子力学到复杂科学都证明了名词思维与动态存在之间的差异,也是先验与经验之间的鸿沟。名词思维是成本最低而效率最高的思维方式,以建构的方式迅速地把万物归类定性,固定在整整齐齐分门别类的结构里,就像图书馆,可问题是,世界并不像图书馆。名词思维的建构能力是优势,但其建模是失真的。
名词思维估计是自然语言自动生成的。既然名词是语法上的第一主角(主语),并且在语法上也占据了对象的位置(宾语),也就自动成为“法定的”思想对象。我们对语言事实无可抱怨,就像对宇宙无可抱怨一样。自然语言在历史中形成,有着迭代经验负荷,我们没有必要也不可能去改变一种自然语言。可是思想还需要更大的自由余地,还需要更准确的表达,还需要表达万变的动态,或者说,思想需要与存在同步,而不是与语法同步。为了与存在同步,人类在自然语法之外另外发展了不同用途的语言,包括诗、逻辑和数学(比喻性的“语言”不算在内,如“绘画语言”“舞蹈语言”“音乐语言”,这些在实质上不是语言)。
诗可以容纳乔姆斯基反对的不合语法的、自相矛盾的、荒谬的表述,比如“无色的绿色意象”或“暴怒而安静的念头”“奇大无比的小蚂蚁”“令人恶心而迷人的眼睛”这样貌似荒谬的词句在诗里出现是平常的,荒谬的表述在诗中有时或比正常语法更接近存在——真实生活往往混乱无序或自相矛盾,既有趣又无聊,既欢乐又痛苦,自相矛盾的诗句与自相矛盾的经验反倒是一致的。
思想和知识却必须逻辑一致。如果思想和知识是混乱的,人类可能现在还在什么地方苦苦挖根茎吃。数学语言是逻辑的典范,定义了一个由理想事物及其完美关系构成的世界,几乎是上帝标准的世界。但数学不是真实世界的反映,而是用来衡量真实世界的绝对标准尺子。数学表达的是,假如存在及其关系是理想化的,那么必然如此这般。数学几乎就是真理的化身,是真理的最后保证,因此,不难理解20世纪初期的数学危机何以引起严重的智力恐慌。康托集合论、逻辑悖论、哥德尔定理还有量子力学一起釜底抽薪地打击了真理的绝对性,从而迫使人类对思想进行了深刻反思。这篇文章里我略过了这个极其重要的反思运动,是因为数学自愈了,数学很快就调整自身而超越了危机,似乎还没有严重的后遗症,简单地说,数学放弃了要求过高的普遍公理化运动,收敛为只在某些有限系统里实现公理化,而对于无穷开放的系统,就只以有穷的能行性(feasibility)去保证真理性。能行性也是人工智能的运作标准,这意味着,我们不能指望人工智能在每件事情上永远正确,因为人工智能也不能遍历无穷多可能世界。
如果说数学语言更接近理想化的存在本身,逻辑语言就更接近理想化的思维本身。按道理说,20世纪的数学危机和物理学危机“应该”连带触动对逻辑的彻底反思,但逻辑学只是对悖论、蕴含问题以及各种逻辑分支进行了一些反思,对逻辑系统进行了修补、优化和升级,但没有发生根本性的反思或系统性的改变,看来人们对逻辑的信念最为顽固。逻辑肯定不存在算法上的疑点,但请允许我对逻辑提出一个概念性的疑问:在名词思维的限制下,逻辑似乎遗漏了某个可能的思想维度。通用的逻辑是名词逻辑,虽然在系统的一致性和完备性上几乎无懈可击了,但似乎遗漏了关于动词的逻辑问题。动词都被转换为名词化的“行动”或“事件”而按照名词逻辑去理解,涉及动词的事情一般处理为模态逻辑或模态逻辑的分支变形(比如“行动逻辑”)。但是,把动词加以名词化,定义为限定的“事件”,动态性就消失了,只见动词产生的名词结果。名词和动词分别要揭示的问题终究有着根本差异,名词和动词在思想上也有不同的性质,动词的意义并不能完全还原或转换为名词。因此可以提问:假如我们选择的思想对象不是名词,而是动词,会怎样呢?为了充分表达思想可能遇到的问题,似乎需要在名词逻辑之外增加“动词逻辑”,它或能敞开思维里相对被忽视的一个或许更重要的维度。此外,动词逻辑或可能对人工智能的思维有帮助,我这样幻想。
(二)名词逻辑与动词逻辑承诺不同的世界观
名词思维与动词思维分别自动预设的“世界观”有着不可忽视的差异。名词思维的世界观是形而上学,动词思维的世界观是存在论。
存在论通常归入形而上学,但这个分类有些勉强,两者虽有关系,但各自可开发的问题及其路径有所不同。源于古希腊理想主义假设(尤其是柏拉图的理念论)的形而上学是对超越的世界的设想,即对超越了现象和经验的纯粹理性的概念世界(比如由理念组成的世界)的设想。这种世界观指定了形而上学的研究对象是完美存在(the perfect being)或绝对存在的完美性。与研究“不完美的”自然现象的物理学相对而言,对超越的完美存在的研究就是形而上学。与之相关而有所不同,源于中世纪的存在论(尽管关于存在的问题可追溯到古希腊)试图研究不存在何以成为存在,以及存在如何存在,核心问题是存在的本源,转换为神学视域则是“创造存在”的创世论,即存在如何从无到有,如何从可能到实在。创世论表面上是神学,实为存在论的关键问题。《周易·系辞下》从非神学的世俗角度也提出了创造的问题,即人之“作”,暗示了一种属于人的非神学创世论,尤其是提出了不可预定的“未来”问题——这才是最重要的存在论问题。
研究不确定性或流变的哲学不多,而且被边缘化,大多数哲学都属于追求确定性、普遍性、必然性、永恒性和完美性的名词哲学。名词形而上学相信,理性思想能够将任何事物定性地定义为某个名词。这就承诺了,存在着完美概念,或理想型(柏拉图式的理念),能够对事物形成定性理解,即为事物建立封闭而永久不变的身份“边界”。基于名词的承诺,名词哲学发展出一系列形而上学信念,包括自身同一性(identity)、恒定本质、绝对性、必然性、永恒性、唯一性、独立性、个体性之类,意味着任何事物都有其不可变更不可替换的唯一注册标识——这不算文学比喻,名词的实质就是注册标识。名词思维不是根据事态去理解事物,而是根据虚构的名词标识去规定事物。名词即限制,定义即边界,名词思维就是独断论,当名词思维进而按照分类学为世界建立了名词等级制,就成为思想专制主义。名词思维导致了一个基本错觉,它诱导思想以为世界是由许多各自独立的事物组成的,以为世界是一个数学式的大集合,集合里又有无数子集,它们之间存在着种属的等级关系。这种“拟人的,太拟人的”想象一厢情愿地把人类的语法、分类学和概念系统当成先验秩序加于万物,而世界本身的自在状态绝非如此,肯定不存在一个由分类学、集合论和名词体系所描述的秩序。不过,我们不可能反对名词和分类学,这是虽不真实但绝对必要的思维工具。这里指出名词思维的虚构性,只在于提醒,在名词思维之外,思维还需要增加其他维度。
名词的思维语法是逻辑,我们所知的逻辑只是名词逻辑。在语言里,名词代表了确定的、不变的、定性的思想对象,逻辑就必须处理以名词为主导的命题之间的真值关系。前面提到了排中律、矛盾律甚至同一律的严格有效范围只限于概念和命题,不能无条件地应用于真实世界和经验。在此我愿意提到名词逻辑另一个或更严重的局限性。在逻辑的基本连接词里,唯一的动词是蕴含。这件事情很奇怪,难道所有动词都可以还原为蕴含?显然不能。当然可以说,逻辑不是对真实世界的解释,而是对思想命题的真值关系的解释,所以“蕴含”就够用了。可真正的问题不是“蕴含”对于逻辑是否够用,而是这种逻辑是不够用的。思想必须解释一切可能的关系,只有一种仅限于解释真值关系的逻辑是不够的。更明白地说,对于思想,真值逻辑不够用。逻辑虽然没有解释世界的任务,但必须足够解释思想,否则,逻辑的作用就非常有限了。在知识论的最低要求上,逻辑至少必须能够清楚地表达因果关系,否则就失去对大多数知识的表达能力。
既然蕴含是名词逻辑里唯一的动词,那么,蕴含就理应能够表达因果关系。实质蕴含的真值关系确实包含了因果关系,可是也包含了非因果的关系,比如语义关系、集合关系和推论关系,这些性质完全不同的关系在蕴含的真值关系里无法区分,无法分辨,也就无法表达因果关系的必然性,等于对因果关系无所表达。比如合法的蕴含命题“如果a是苹果,那么天在下雨”就不是因果关系,可见实质蕴含缺乏足够分辨力来表达因果关系。我猜想休谟不会接受以实质蕴含p→q来表达因果关系,他不会容忍因果命题与分析命题合并同类项,他或宁愿采用p∧q。然而对于因果关系,p∧q也是个坏的表达,不值得推荐,尽管略接近休谟承认的“总是先后出现”的经验关系。或可考虑用真值等值p≡q来表达因果关系,必然性有了,但约束又太强了,因果往往不能倒推,因此会排除掉太多的因果关系,不利于经验知识的建构,估计休谟不会同意。假如人工智能学会使用通用逻辑系统,对人工智能帮助最少的连接词恐怕会是实质蕴含(其他连接词都很有用),实质蕴含对事实关联的分辨力很弱,对于人工智能寻找标识关联性大概没有什么积极助力,如果不产生误导就算好事。人工智能采用的贝叶斯方法在寻找标识关联性上明显要比实质蕴含强得多。
逻辑可以辩护说,实质蕴含只是表达可能形成推理条件的真值关系。但这一点也是可疑的,在逻辑上合理的蕴含怪论比如“如果2+2=5,那么雪是白的”,真的很难将其视为有效推理的逻辑条件——虽然在真值关系上是成立的,但实际上无用。毫无疑问,真值关系在逻辑形式上是正确的,没有人会质疑逻辑的形式正确性,但这里提出的是知识论上的疑问:如果蕴含不足以有效地表达因果关系,逻辑就与知识的真理性几乎无关,那么逻辑的意义就十分有限了。曾经一度有些逻辑学家相信逻辑是对数学的解释,但实际上数学自己足以解释自身。请逻辑学家不要误会,再说一遍:没有人质疑逻辑的正确性,逻辑本身没有错误。但如果逻辑不足以表达思想如何产生正确的知识,那就有问题了。
为什么不能回避这个讨厌的问题?假如逻辑不能表达一切有效的思想关系,那就意味着现有的逻辑在逻辑上可能漏掉了什么重要的事情,可能缺少某种必要的功能。现代逻辑是现代数学公理化运动的一个产品。公理化堪称完美主义的完美理想,为了建构完美的系统,就宁可回避或牺牲某些重要却不完美的事情,以免影响公理化的成功。于是,现代逻辑重视逻辑系统本身的一致性远胜过重视逻辑对知识和思想关系的充分表达能力,或者说,现代逻辑更关心如何建造一个完美的“建筑”,却不太关心这个“建筑”是否够用。问题就在这里,现代逻辑就其本身而言很完美了,但对于思想和知识需要表达的关系来说却不够用。当然尽可以把逻辑狭隘地限定为命题的真值关系,这样就可以对许多思想关系不负责任,但如此自我限制的逻辑难免令人失望。因此我在想象,如果允许扩展逻辑的概念,就可以考虑增加一种“动词逻辑”,专门研究动词的知识性质以及动词的逻辑关系,从而与名词逻辑形成互补。
动词逻辑的哲学基础一定是研究“生成存在”(becoming of being)的存在论,而不是研究“万物之存在”(being of beings)的形而上学。这意味着:(1)动词逻辑关心的是如何描述一个动态(动词)生成另一个动态(动词)的关系,即试图描述变化的过程性。这不同于名词逻辑把动态关系转换为名词之间的关系,屏蔽掉命题的丰富取值而只取抽象的真值,然后只计算真值函数。换句话说,动词逻辑试图配合复杂科学去表达生成性的“涌现”而不是名词逻辑要确定的完美“结构”。(2)动词逻辑与存在论在核心问题上是重叠的,都试图研究“起源”和“未来”,但不是神学或宇宙物理学里特指的万物起源和未来,而是在任何时间点上发动某种事情的起源和未来。(3)动词问题也就是“作”(to make)的问题,即“以作而在”(to make x to be)的问题,具体地说,就是如何创造(生成)一个后继。在名词逻辑里,p及其后件q都是给定的,连真值赋值也事先给定了,在哲学意义上相当于未来提前到达,即取消了“未来”的问题。只要后件q的真值是已知的,未来就被取消了,只剩下复盘式的演算。但在动词逻辑里,p是给定的,但q却是未定选项,于是未来就成为一个问题。所以动词逻辑也是存在论的逻辑。(4)因果关系被转换地表达为“输入动词—输出涌现”的生成关系。动词意味着一个有限系列的能行操作,这些操作(输入)构成了可预测其结果(输出)的“充足理由”。不难看出,这里试图复活长期被逻辑学家排斥的莱布尼兹的充足理由律。
莱布尼兹是个思维缜密的数学家,发明了微积分和作为计算机基础的二进制,他作为现代逻辑的初始设想者,提出充足理由律不太可能是无稽之谈或偶然脑热。充足理由律在数理逻辑里难以表达,因此被认为属于哲学而不是逻辑定理。这种批评有道理,充足理由律的确是存在论的定理,可用来表达因果关系,不是现代逻辑里的形式定理。然而,现代逻辑不能良好地表达因果关系,这无论如何是个局限性,如前所论,因果关系不可以由“前假后真”的蕴含来表达。如果逻辑的有效性仅限于已知的真值关系而与未知的未来无关,就失去了对经验知识的表达力。我猜想这也是莱布尼兹心中的疑虑。
我对动词逻辑的想象的部分灵感就是来自莱布尼兹的充足理由律(可以表达因果)以及他的可能世界概念(可以表达未来)。当然我的理解也可能有错,动词逻辑也许与莱布尼兹的充足理由律的情况相似,都属于存在论而终究不能表达为逻辑,但或许能够表达为数学?我必须提到另一个灵感来源,那就是布劳维尔的直觉主义数学。假如我没有过度诠释或歪曲的话,“保守的”直觉主义数学不能满足形而上学无所不包的雄心,但有助于解释因果关系和未来问题。
(三)动词的链接:可能性如何收敛为必然性
这里关于动词逻辑的论说只是哲学上的纸上谈兵,无法形成技术细节。但不妨提出可讨论或可争议的几个要点:
1.动词逻辑不需要与自然语言的语法保持一致性,不以名词(被定义的事物)作为思维对象,而以动词(“发生”的动态)作为思维对象,并且以动词作为描述和分析事态的初始值或出发点去预测下一步链接。至于名词,则可理解为动词的相关项,归入“语境”的设置。于是动词逻辑的视域、组织方式和世界建模,或者说动词逻辑的“语法”,就明显区别于自然语法或名词逻辑。动词逻辑的世界建模或可能更接近世界的实际生成状态。我尚无能力设计一种动词语法,权且按照我的野蛮想象,比如说,动词V1为起始点,理论上在时间和空间上形成万向链接,形态上表现为以动词为圆心的散布链接,同时链接过去和未来的相关项,也链接四面八方的相关项,这些相关项是名词(代表了事物),以动词V1为圆心形成了一个“动词—名词”群组。一个“动词—名词”群组必定引发另一个动词V2的群组,相当于不断开启未来,如此展开的时间就构成真实世界,不同于由名词分类学构成的概念世界。
2.任何动词的意义都在于未来,因此,动词逻辑与存在论或人工智能一样,关心的核心问题都是“未来”,具体化为“下一步”。对于人工智能,未来是下一步的预测;对于动词逻辑,未来是下一步的生成。未来由无数不确定的可能性潜在地构成,潜在就是尚未存在,而动词就是创作未来。这里与无中生有的世界神学起源无关,所有动词都理解为发生在时间的正中间,意味着每个动词都有无限的历史和无穷的未来,每个动词都是另一个动词的下一步。于是动词的链接就构成了事态的动态描述,就是说,世界的事态并不是一个事物(名词)与另一个事物(名词)的关系(语言图像),而是一个涌现(动词)与另一个涌现(动词)的关系(动态模型)。在思维领域里,动词要“夺权”。
3.每个动词都意味着对可能性的选择,如何压缩过多的可能性就成为关键。动词承载着意向性,但一厢情愿的意向未必能够落实为动词,动词只能在给定的约束条件下去考虑可实现的最优可能性。棘手的事情就是要在“无数”可能性中排除大多数可能性,即压缩可能性的问题。无数选项吓死人,但人类没有被吓死,而是理直气壮地排除了大多数可能性:一大部分可能性缺乏现实条件,做不到的事情被排除了;另有一大部分可能性处于待机状态,要等待在不断选择的无限过程中慢慢显现出来,那些需要等待的非显现可能性也被排除了。就每个“下一步”而言,行为者对于无穷多可能性其实只有一个有限的接触扇面,可选择的邻近可能性或合适可能性并不多,实际上所剩无几。但事情依然不简单,剩余的每个可能性都暗含着无穷的“博尔赫斯分叉”,即不断分叉的未来。在这种条件下让人工智能去选择,它会根据大数据去选出综合关联性最高的那个选项,这种选择的正确率很高,但几乎必定是平庸的选择。这可以解释为什么人工智能创作的文章、诗歌和各种艺术虽然不差但很平庸——处处符合规范、标准、教义和时尚风格的事情一定正确甚至时髦但是平庸。
4.有何种方法论能够助力人工智能作出不平庸的选择?这是涉及创造性而难以解释的大疑问,人类至今还不能解释思维的创造性。创造性超出了逻辑,这里不予讨论,但可以讨论一个“近乎”创造的替代问题,即以全然无知的未来作为“赌注”,试图把可能性变成必然性。这是一个反逻辑的问题,按照逻辑定理,必然性蕴含可能性。如果可能性蕴含必然性,则是荒谬的,类似神学相信的那种不可思议的事情。但这是名词逻辑的定理,动词逻辑却未必如此。如果以博尔赫斯的未来时间分叉为给定条件,未来就不是一个名词。未来是不确定的、不断变化的、不可预知的,更不可能定义,因此,未来不是一个概念,而是一个具有无限分叉可能性的树状图。正如休谟问题提示的,未来不是前件所蕴含的后件,反而是后件对前件的证明。在名词逻辑里不存在从必然性逃逸出去的未来,因此,不可确定的未来在名词逻辑里实际上不存在。这一点与前面分析过的先验论局限性是一致的,即先验原则对于无穷的未来没有控制力,未来永远逃逸在必然性的原理之外。因此,我们有理由来设想一种分析未来问题的动词逻辑。
5.如前所述,对未来的最好的经验主义预测是贝叶斯方法,所以,人工智能在寻找最优的“下一步”时也使用贝叶斯方法。在知识论意义上,贝叶斯方法足够好,但知识论的目标和要求也限制了对未来可能性的选择方式,即只求“答对”题目,于是只能产生平庸的结果。动词逻辑属于经验论,但承担的却不是知识论的任务,于是动词就成为一个存在论问题。事实上,在许多时候,未来不是知识论的问题,而是存在论的选择,因此,动词除了需要规避风险,有时候还需要“有效的冒险”去探索非平庸的可能性。在广义上,无论是科学、艺术还是日常生活,其中的所有“创意”都属于冒险。创意是非逻辑的,但如果一系列连续的创意在有限的可能性之间建立了必然性,就相当于建立了一种特殊的“逻辑”。这也不是比喻。“通用的”逻辑(形式逻辑或数理逻辑)其实也是特殊逻辑,只限于在基于名词思维的命题真值之间有效,而在其他取值下无效,在其他可能世界里也未必有效(比如前面讨论到的排中律、矛盾律和同一律的约束条件)。
6.要在复数的可能性之间强行建立必然性,需要解决的问题是,如何通过一系列的动词把复数可能性收敛为单数可能性,也就成为必然性了,在效果上等于创造了一个无法否认的事实。在未来无限分叉的树状图上,每个节点(分叉点)都表现为若干可能性的或取状态,一个动词的自由选择就引向下一个动词的选择。如果动词的连续选择是冒险的,而并不总是服从贝叶斯的后验概率——似乎有些非理性,但同时是创造性的,居然最终把可能性约束为必然性,即能够让一系列的或取选择产生了递归终止(无可选择了),那就是一系列动词的最终涌现结果。这个创造性的结果就强行产生了新的现实,相当于创造了在特定约束条件下的某种必然性。反过来看,当一个动词系列,相当于动词的一个输入串,连续做功而生成了某个必然结果,就必定存在一个皮尔士的溯因推论成为它的逆运算,即从最后的“输出”可以推测先前的一系列“输入”,简化地说,有些类似于可以从一台机器的运行效果去反推其设计的局限性或弊病,或者类似于侦探从犯罪事实去反推最可能的嫌疑人并建立充分的证据链去反推犯罪行为。这里在理论上的结论是,在知识论上,由于受限于无穷性的不可穷尽状况,也许永远无法充分证明客观世界里一切事物的因果关系,但在存在论上,由人做主的动词(连动的动词串)却制造了由可追查(可侦探)的连续线索所构成的或被动词所规定的因果关系。因此可以说,真正能够充分理解的因果关系其实是一个动词问题。
如果把存在论从研究普遍存在的神学视域收缩为人的视域,“何以存在”的问题就转化为人的创造问题,而因果关系就收缩为动词关系,这样一种收敛的存在论有可能更好地解释人的思维、存在和人文世界。既然“万物理论”已经移交给了物理学,哲学就没有必要当真地去设想等价于神学视域的万物普遍理论,传统的形而上学至多是一个理论性的参照系,不再是能够推进的哲学问题。
如果动词思维能够更好地解释人的思维,那么或许也能够提高人工智能的智商。逻辑学未必需要动词逻辑,就像不需要莱布尼兹的充足理由律,但动词逻辑实质上是一个思想或哲学的方法论问题。假定动词逻辑有助于解释世界和人类生活,也就或许有助于人工智能去理解人类的所作所为,比如说,以动词为出发点去重新组织和重新理解无数标识的关系,或对标识预测能力有所增强也未可知。人工智能愿意兼收并蓄吗?
〔本文注释内容略〕
暂无留言