|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?注册
×
作者:微信文章
一、历史与研究目标
背景:1950s 计算机主要被视为“数值计算器”。Newell、Simon 与 J. C. Shaw 想证明:计算机也能进行符号推理(像人那样“想问题”),而不只是算数。
目标任务:自动证明《Principia Mathematica(《数学原理》)》命题逻辑部分的一批定理;用程序复现/发现证明。
方法论宣言:智能可被看作符号表示 + 规则操作 + 搜索控制。——这几乎奠定了符号主义 AI 的教科书范式。
二、知识与表示(Representation)
对象语言:命题逻辑的良构式(WFFs),以内部符号串/树表示(当时用自研的 IPL:Information Processing Language 做表与指针结构处理,堪称早期“列表处理”体系,影响了随后 Lisp 的诞生)。
知识来源:
一组公理模式/等值式(来自《数学原理》命题演算部分)。
若干推理/变换规则(如替换/同一式替换、拆装括号、等价变形、以及Detachment——功能上相当于对蕴涵的“分离/类 Modus Ponens”)。
内部表示要点:
公式被分解为运算符(如 →, ¬, ∧ 等)与命题变元的结构。
允许模式匹配(pattern matching)与变量替换(substitution),以便把目标公式与公理模式对齐。
(将数学元素折叠成可被模式匹配与操作替换的语法符号,表示是计算的前提,现代大模型里的tokenization和embedding也是这个过程,表征的度量空间即推理的可达空间)
三、证明作为搜索(Search as Proof)
核心思想:把“要证明的定理”视为目标状态,把“应用某个公理/推理规则后的中间式”视为状态转移;于是证明过程=在状态空间里搜索一条从前提到结论的路径。
搜索框架:树/图搜索(当时主要是深度优先变体,配合回溯)。
状态与动作:
状态:当前可用的公式库(axioms + 已得中间定理)、未完成的子目标栈。
动作:应用某条规则/某个公理模式做变换或引入中间命题;把复杂目标分解为可达的子目标(subgoaling)。
(将推理转化为一个状态空间搜索问题,之后再谈启发与学习)
四、启发式与控制(Heuristics & Control)
为避免“盲搜爆炸”,LT 的关键是启发式控制——它们是论文的精华。
差异-减少(difference-reduction)/手段-目的分析(means–ends analysis):
定义“目标式”和“当前式”的差异类型(如主算符不同、子式结构不同、变量/常元不匹配等),选择最可能缩小差距的规则。
匹配度排序:优先选择能让式子“更像目标”的变换;若有多条可行规则,则按“缩差”效果排序。
子目标栈与回溯:失败就回溯,换下一条启发路径;成功则把中间结果登记为新“引理”以复用。
裁剪策略:对引起表达式膨胀或明显离目标更远的尝试早停;避免在等价变形的循环中打转。
(启发式控制类似人类推理的过程:凭直觉排除明显不可能的路径,优先选择较好路径,将资源理性分配)
五、系统结构与运行(Architecture & Run)
实现语言:IPL(列表与指针操作、符号重写),这是当时为符号处理专门打造的原型语言。
工作记忆:维护“当前可用公式集”“子目标栈”“已尝试变换的痕迹”(防止环路/重复)。
证明产出:不仅给出“可判真”,还能打印出可读的证明序列(公理/引理/替换/推理链),这使得结果具有“数学证明”的可核验性。
六、实验与结果(Experiments & Results)
任务集:选取《数学原理》命题演算部分的若干十条经典定理(文献常引为“首批 52 条中的 38 条成功”——不同复述略有出入,但范围在此)。
成功指标:
找到从公理到目标定理的有效证明链;
部分定理的证明比书中更短/更“优雅”(这是当时轰动性的亮点)。
失败模式:在启发式不够“聪明”或差异度量不敏感时,可能陷入长时间搜索或回溯风暴。
七、对ai的影响1.第一个真正意义上的ai程序。2.确立了“符号主义 AI”的范式:智能 = 符号表示 + 规则操作 + 启发式搜索。3.引入“搜索”:把逻辑证明过程形式化为在状态空间中搜索路径。这是 AI 的基础思想之一:几乎所有问题(证明、规划、博弈、优化)都能转化为搜索问题。后来“启发式搜索”“A* 算法”等核心技术,都与 LT 的思想一脉相承。4.启发式与手段–目的分析(Means–Ends Analysis):为了避免穷举,LT 使用启发式控制,把“目标”分解为“子目标”,逐步减少与目标的差异。这成为 问题求解器(GPS, 1957) 的基础,并在认知科学中发展为对人类问题解决的解释模型。
5.暴露了 符号主义AI 的瓶颈:知识工程负担:启发式需要人类专家手工设计。规模化难题:定理复杂度上升时,搜索迅速爆炸。缺乏学习能力:系统不能像人一样通过经验自动改进。这些缺陷直接推动了后来机器学习和连接主义的兴起。
博尔赫斯在《特隆·乌克巴尔·奥尔比斯·特丢斯》提到特隆是一个超现实的世界,特隆的语言体系中没有名词,只有动词与形容词,于是在特隆人眼里,世界不是物质的而是由观念和流动的体验构成。博尔赫斯通过虚构的语言实验来体现萨丕尔–沃尔夫假说:语言结构决定思维方式。所以对于ai来说,ai的上限或许源自最底层的语言体系,不同语言的ai发展前景是不同的。故事的最后,博尔赫斯描写了一种诡异的结局:特隆的思想和语言逐渐渗入现实世界,人类学者开始研究它,媒体传播它,学者出版论文。结果,现实中的学科逐渐被“特隆化”:数学、哲学、历史都被重写。最终,人类的现实正在被虚构的“特隆”世界取代。这是符号的反扑。文本原本是描述世界的,但当它的权威性与传播性足够强大时,它会倒过来塑造世界,所有的智能在符号规则改变后都会变得脆弱。
“同特隆的接触,对特隆习俗的了解,使得这个世界(现实世界)分崩离析。特隆的(假设的)“原始语言”已经进入学校;它的(充满动人事迹的)和谐历史的教导一笔勾销了我小时学的历史;虚幻的过去在记忆中占据了我们从未确知的——甚至不知是假的过去。古钱币学、药物学和考古学已经重新修订。据我所知,生物学和数学也将改变……一个分散各地的独行者的王朝改变了地球面貌。它的任务仍在继续。如果我们预见不错的话,从现在起不出一百年,有人将会发现一百卷的《特隆第二百科全书》。那时候,英语、法语和西班牙语将会在地球上消失。世界将成为特隆。我并不在意,我仍将在阿德罗格旅馆里安静地修订我按照克维多风格翻译的托马斯·布朗爵士的《瓮葬》的未定稿(我没有出版它的打算)。” |
|