逻辑,可解释性与理解的未来

关于基本逻辑的发现徳赢彩票游戏

逻辑是许多事物的基础。But what are the foundations of logic itself?

在符号逻辑中,一个引入符号qto stand for statements (or "propositions") like "this is an interesting essay".那么一个人就有了一定的“逻辑规则”,像那样,对于任何以及任何q不是q)与(不是不是q

但是这些“逻辑规则”是从哪里来的呢?好,逻辑是一种形式系统。And,就像欧几里得几何一样,它可以建立在公理之上。但是这些公理是什么呢?我们可以从以下事情开始q=q,或不是不是=.但一个人需要多少公理呢?它们有多简单?

这是一个长期以来一直在争论的问题。但是周六晚上8:31,1月29日,2000,在我的电脑屏幕上弹出一个轴子。我已经证明了再简单不过了,但我很快就确定了这一个小公理足以产生所有的逻辑:

布尔代数的Wolfram公理,这是生成所有逻辑所需要的。
γ

((P·Q)·R)·(P·((P·R)·P))=R

但我怎么知道这是正确的呢?好,因为我有电脑证明。这是证据,as I printed it在4点输入A 徳赢中国New Kind of Science(而且它是现在可用Wolfram数据存储库):

布尔代数Wolfram公理的计算机生成证明

最新版本沃尔夫拉姆语,现在任何人都可以生成此证明不到一分钟。有了这个证据,它的易于验证每一步。但为什么结果是真的呢?怎么解释?

这也是越来越多的关于各种计算系统的问题,徳赢彩票游戏以及机器学习和人工智能的各种应用。对,我们可以看到发生了什么。但我们能理解吗?

我认为这最终是一个深刻的问题,对科学技术的未来至关重要,事实上,我们整个智力发展的未来。

但在我们进一步讨论之前,徳赢彩票游戏我们来谈谈逻辑,徳赢彩票游戏关于我发徳赢彩票游戏现的公理。

历史

逻辑作为一种形式学科基本上起源于亚里士多德公元前4世纪。作为他毕生努力编目的一部分(动物,causes,等)亚里士多德列举了有效的论证形式,并为它们创建了符号模板,基本上提供了两千年来逻辑的主要内容。

到1400年代,然而,代数被发明出来了,随之而来的是更清晰的事物象征。但直到1847年布尔最后用代数的同样方式表述逻辑,逻辑运算如下被认为是根据代数类规则.

几年之内,人们明确地为逻辑写下公理系统。一个典型的例子是:

典型的逻辑公理系统
γ

和[p,q]==和[q,p]或[p,q]==或[q,p]和[p,或[q,不是[q]]]==p或[p,和[q,不是[q]]]==p和[p,或[q,r]]==或[和[p,q]和[p,r]],或[p,和[q,r]]==和[或[p,q]或[p,r]]==;

但是逻辑真的需要不是?在20世纪的第一个十年之后有几个人发现了我们现在称之为与非门够了,例如,q 计算为与非门与非门q与非门q)(The“功能完整性”属于与非门如果不是半导体技术的发展,实现了在一个现代微处理器晶体管的组合除了与非门或相关功能也不

但是,好啊,那么逻辑(或“布尔代数”)的公理是什么样的呢?与非门?这是已知的第一个版本,从亨利谢弗1913年(这里dot·代表与非门):

谢弗逻辑公理
γ

{(p\[CenterDot]p)\[CenterDot](p\[CenterDot]p)==p,p\[CenterDot](q\[CenterDot](q\[CenterDot]q))==p\[CenterDot]p,(p\[CenterDot](q\[CenterDot]r))\[CenterDot](p\[CenterDot](q\[CenterDot]r))==((q\[CenterDot]q)\[CenterDot]p)\[CenterDot]((r\[CenterDot]r)\[CenterDot]p)}

Back in 1910怀特黑德和罗素的 数学原理已经普及了也许所有的数学都可以从逻辑中推导出来的观点。尤其是考虑到这一点,there was significant interest in seeing just how simple the axioms for logic could be.在这方面最著名的一些工作是在利沃夫和华沙(当时都是波兰的一部分)完成的,particularly by简Ukasiewicz(世界卫生组织,作为他的工作的副作用,发明于1920年的圆括号free_ukasiewicz或“波兰语”符号)1944,66岁时,乌卡西维茨从接近的苏联逃走-1947年在爱尔兰结束。

与此同时,爱尔兰出生的卡鲁梅瑞狄斯,曾在温彻斯特和剑桥接受教育,在剑桥当了数学教练,1939年被他的和平主义强迫回到爱尔兰。And in 1947,梅雷迪思在都柏林参加了Ukasiewicz的讲座,这促使他开始寻找简单的公理,这将占据他余生的大部分时间。

到1949年,梅瑞狄斯找到了两个公理系统

梅雷迪思的两公理逻辑系统,大约1949
γ

(P\[centerdot](Q\[centerdot]R))\[centerdot](P\[centerdot](Q\[centerdot]R))==((R\[centerdot]P)\[centerdot]P)\[centerdot]((Q\[centerdot]P)\[centerdot]P)\[centerdot](Q\[centerdot]P)==P

经过近20年的工作,他在1967年成功了。将此简化为

梅雷迪思简化的两公理逻辑系统,大约1967
γ

P \[centerdot](Q \[centerdot](P \[centerdot]R))==((R \[centerdot]Q)\[centerdot]Q)\[centerdot]P,(P \[centerdot]P)\[centerdot](Q \[centerdot]P)==P_

但能简单点吗?梅雷迪思多年来一直在寻找与非门可以在这里或那里移除。但1967年之后,他显然没有再进一步(他死于1976年)。尽管在1969年他做到了找到三公理系统

梅雷迪思的三公理逻辑系统,从1969
γ

{p\[CenterDot](q\[CenterDot](p\[CenterDot]r))==p\[CenterDot](q\[CenterDot](q\[CenterDot]r)),(p\[CenterDot]p)\[CenterDot](q\[CenterDot]p)==p,p\[CenterDot]q==q\[CenterDot]p}

实际上,当我开始探索逻辑的公理系统时,我并不知徳赢彩票游戏道梅雷迪思的工作。I'd gotten into the subject as part of trying to understand what kinds of behavior simple rules could produce.早在20世纪80年代初,我就令人惊讶的发现甚至细胞自动机也有一些最简单的规则,比如我最喜欢的规则30-会产生非常复杂的行为。

在经历了20世纪90年代基本上试图弄清楚这种现象有多普遍,我最终想知道它如何应用于数学。这是一个直接的观察,在数学中,一个人基本上从公理开始(比如说算术,或几何学,或逻辑)然后试图证明一整套复杂的定理。

但是这些公理到底有多简单呢?好,这就是我1999年想发现的。作为我的第一个例子,我决定看看逻辑(或者,等价地,布尔代数)。与我之前预料的相反,我的经验细胞自动机图灵机,以及许多其他类型的系统,包括偏微分方程-是不是可以开始列举最简单的可能案例,过不了多久,人们就会看到有趣的事情。

但人们能这样“发现逻辑”吗?好,只有一种方法可以告诉我们。1999年底,我开始探索所有可能的公理系统的空间,从最简单的公理系统开始。

In a sense any axiom system provides a set of constraints,说对·q.它没有说什么·q“IS”;它只是给出了·q必须满足(比如,例如,可以这么说·q=·q)那么问题是,从这些性质中,我们是否能够推导出所有逻辑定理,当·q与非门[q]:不多也不少。

有一个direct way to test其中的一些。以公理系统为例,看看有什么明确的形式·q满足公理如果q可以,说,是.如果公理系统只是·q=q·然后,对,·q可以是与非门[q]但它没有。也可能是[q]平等[q]-或者许多其他的东西,它们不能满足与与非门逻辑功能。但通过到达AXIOM系统的时间 {()·q···q·=q}一个人已经到了与非门[q](基本上相当于也不[q])是唯一的“模型”·q至少可以假设q只有两个可能的值。

那么这是一个逻辑公理系统吗?好,不。因为它意味着,例如,有一个可能的形式·q有3个值用于q,但是逻辑上没有这样的东西。但是,好啊,这个只有一个公理的公理系统接近这个事实表明,寻找一个能复制逻辑的公理可能是值得的。这就是我在2000年1月所做的(这些天变得更容易了,特别要感谢手巧,相当新徳赢中国沃尔夫拉姆语功能分组

很容易看出,没有3个或更少的公理。”与非门S(或)真的?3个或更少的“点运算符”)可以工作。周六早上5点之前,1月29日(是,我是一个夜猫子然后)我发现四个都没有与非门S也可以工作。当我在早上6点后停止工作的时候,我有14个可能的候选人,5个与非门S.但周六晚上我又开始工作,做了更多的测试,这些候选人都失败了。

所以,不用说,下一步是用6个与非门S.总共有288684个。但是我的代码很有效,没过多久,我的屏幕就出现了(是的,从Mathematica版本4):

逻辑公理的25个不等式6-NAND候选者,由Mathematica 4生成

起初我不知道自己有什么。我只知道这些是徳赢中国25等量6-与非门公理比5个都要远-与非门那些。但他们中有谁真的是逻辑的公理系统吗?我有一种(相当密集的)经验方法可以排除公理。但唯一能确定任何公理是否正确的方法是证明它能够成功地复制,说,舍弗逻辑公理。

这需要一些软件方面的争论,但在许多天过去之前,我发现25个人中的大多数都不能工作。最后,只有两个幸存:

((P·Q)·R)·(P·((P·R)·P))=R
γ

((p\[centerdot]q)\[centerdot]r)\[centerdot](p\[centerdot]((p\[centerdot]r)\[centerdot]p))==r

(P·((R·P)·P))·(R·(Q·P))==R
γ

(p\[centerdot]((r\[centerdot]p)\[centerdot]p))\[centerdot](r\[centerdot](q\[centerdot]p))==r_

令我兴奋的是,我成功地让我的计算机证明这两者都是逻辑的公理。我使用的程序确保了逻辑中不可能有更简单的公理。So I k徳赢中国new I'd come to the end of the road: after a century (or maybe even a couple of millennia),我们最后可以说,最简单的逻辑公理是已知的。

不久之后,我发现了两个2-公理系统,also with 6与非门总的来说,我证明可以重现逻辑:

两个公理逻辑系统,共有6个NAND,可复制逻辑(1/2)
γ

(p\[centerdot]q)\[centerdot](p\[centerdot](q\[centerdot]r))==p,p\[centerdot]q==q\[centerdot]p_

两个公理逻辑系统,共有6个NAND,可复制逻辑(第2个,共2个)
γ

(p\[centerdot]r)\[centerdot](p\[centerdot](q\[centerdot]r))==p,p\[centerdot]q==q\[centerdot]p_

如果选择交换性·q=q·理所当然,然后这些显示,获得逻辑只需要一个很小的4-与非门公理。

为什么它重要

好啊,所以说一个人“完成了亚里士多德所开始的”(或者至少完成了布尔所开始的),并找到了最简单的逻辑公理系统,这很简单。但这只是一种好奇心,还是有真正的意义?

在我在年开发的整个框架之前A 徳赢中国New Kind of Science,我认为人们很难看到它,而不仅仅是好奇。但现在我们可以看到它实际上与各种基本问题联系在一起,比如人们是否应该考虑数学是被发明还是被发现。

人类实践的数学是基于少数特殊的公理系统-实际上每一个定义了一个数学领域(比如逻辑,or group theory,或几何学,或集合论)。但在摘要中,实际上,每个系统都有无限多的可能公理系统定义数学领域原则上可以研究,即使我们人类从来没有这样做过。

以前A 徳赢中国New Kind of Science我认为我隐含地认为,几乎所有在计算宇宙中只是“存在”的东西,在某种程度上肯定比我们人类明确建立和研究的东西“不那么有趣”。但是我对简单程序的发现徳赢彩票游戏清楚地表明,至少在我们精心挑选的系统中,“外面”的系统通常比“外面”的系统丰富得多。

那么,关于数学的徳赢彩票游戏公理系统呢?好,为了比较“外面”的东西和我们人类所研究的东西,我们必须知道,我们研究过的现有数学领域的公理系统,如逻辑,实际上位于何处。基于传统的人类构造的公理系统,我们可以得出结论,它们必须远一点,实际上,只有当人们已经知道它们在哪里时,才能找到它们。

但我的公理系统发现基本上回答了这个问题,"How far out is logic?" For something like cellular automata,分配一个数字特别容易(就像我在20世纪80年代初那样)每个可能的细胞自动机。用AXIOM系统做这个有点困难,虽然不多。一种方法,我的公理可以标记为411;3;7;118,用Wolfram语言构造为:

Wolfram语言中布尔代数的Wolfram公理
γ

分组[{Qr[1+整数位数[411,三,7)]CenterDot -> 2][[118]] == r

至少在可能的功能形式空间(不考虑变量标记)以下是公理所在位置的直观指示:

布尔代数的Wolfram公理,在可能的函数形式空间中可视化

考虑到我们人类研究的许多形式系统的基本逻辑是什么,我们可能认为,在任何合理的陈述中,逻辑对应于最简单的公理系统之一。但至少在(与非门-基于)我们使用的表示,那不是真的。在大多数情况下,它仍然有一个非常简单的公理系统,但如果一个人刚开始列举最简单的公理系统的话,可能会遇到十万个公理系统。

So given this,下一个明显的问题是,其他的公理徳赢彩票游戏系统呢?这些是怎么回事?好,这正是那种调查A 徳赢中国New Kind of Science都是关于。徳赢彩票游戏实际上,在这本书中,我认为,像我们在自然界中看到的系统这样的东西,往往最能准确地被那些“其他规则”捕获,我们可以通过列举可能性来找到这些规则。

对于AXIOM系统,我做了一个图片这代表了与不同的可能公理系统相对应的“数学领域”所发生的事情。每一行显示一个特定公理系统的结果,页面上的框指示该公理系统中的特定定理是否正确。(是的,在某一时刻G_德尔定理咬一口,在一个给定的公理系统中,证明或反驳一个给定的定理变得不可约的困难;在实践中,我的方法就在右边图画展示……

不同数学领域定理中的候选公理系统的结果

有什么本质上的特殊之处吗徳赢彩票游戏“人类学”数学领域?从这张照片上,还有我学过的其他东西,似乎没有什么明显的迹象。事实上,我怀疑这些数学领域唯一真正特别的东西,就是历史事实,它们就是我们所研究的。徳赢彩票游戏(One might make claims like that they arise because they "describe the real world",或者因为它们“与我们大脑的工作方式有关”,but the results inA 徳赢中国New Kind of Science反对这些。)

好吧,那么,我的公理系统对逻辑有什么意义呢?作为一个公理系统,它的大小给人一种逻辑的终极信息内容的感觉。And it makes it look like—at least for now—we should view logic as much more having been "invented as a human construct" than having been "discovered" because it was somehow "naturally exposed".

如果历史不同,我们经常(以A 徳赢中国New Kind of Science)在许多可能的简单公理系统中,然后,也许我们已经“发现”了逻辑的公理系统,因为我们碰巧发现了一个有趣的特性。但是考虑到我们已经探索了这么少的可能的简单公理系统,我认为我们只能合理地把逻辑看作是“发明”的东西——通过以基本上“随意”的方式构造。

在某种意义上,这就是逻辑的表现,说,早在中世纪,可能的三段论(或有效的论点形式)是由(拉丁语)助记法,如芭芭拉和西勒朗。为了反映这一点,找到助记法是很有趣的,因为我们现在知道的是最简单的逻辑公理系统。

从开始((·qR····()·RR,我们可以代表每一个·q在里面prefix or Polish form(与HP计算器的“反向抛光”相反)asDPQ-所以整个公理可以写成=dddpqrdpddpr。然后(作为)艾得·佩格我发现了)这里有一个英文助记符:找出队列,在哪里?qR是U,re.或者,查看单词的首字母(使用运算符B,和qR作为A,PC):“一点一点,一个程序计算了布尔代数的最佳二元公理,涵盖了所有情况”。

证明力学

好啊,那么,如何证明我的公理系统是正确的呢?好,要做的最直接的事情就是证明,从中可以为逻辑推导出一个已知的公理系统,就像谢弗的公理系统:

谢弗逻辑公理系统
γ

{(p\[CenterDot]p)\[CenterDot](p\[CenterDot]p)==p,p\[CenterDot](q\[CenterDot](q\[CenterDot]q))==p\[CenterDot]p,(p\[CenterDot](q\[CenterDot]r))\[CenterDot](p\[CenterDot](q\[CenterDot]r))==((q\[CenterDot]q)\[CenterDot]p)\[CenterDot]((r\[CenterDot]r)\[CenterDot]p)}

这里有三个公理,我们必须推导出它们中的每一个。好,与Wolfram语言的最新版本,这就是我们要做的,说,第二个公理:

第二个谢夫逻辑公理,源于Wolfram语言
γ

pf=findeQuantionalProof[p\[centerdot](q\[centerdot](q\[centerdot]q))==p\[centerdot]p,\!\(\*SubscriptBox[\(\[ForAll]\),\(p,Qr \)]\(\((((p \[centerdot]q)\)\[centerdot]r)\)\[centerdot]\((p \[centerdot]\(((p \[centerdot]r)\)\[centerdot]p)\)\)==r\)\)]

值得注意的是,现在可以这么做了。“证明对象“记录证明中使用了125个步骤。从这个证明对象,我们可以生成一个记事本来描述这些步骤:

从Sheffer第二逻辑公理的证明对象生成笔记本
γ

pf[“校对本”]

In outline,结果是证明了一系列中间引理,最终得出最终结果。在引理之间有一个完整的相互依赖网络,如图所示:

Wolfram语言中中间引理之间的相互依赖性谢弗逻辑第二公理的证明
γ

pf[“校对”]

下面是推导谢弗公理系统中所有三个公理所涉及的网络,最后一个公理涉及的步骤有504个:

从Wolfram语言的三个Sheffer逻辑轴派生的相互依赖网络

And,对,很明显这些都很复杂。但在我们讨论这种复杂性意味着什么之前,让我们谈谈这些证明的各徳赢彩票游戏个步骤中实际发生的事情。

基本的想法很简单。假设我们有一个公理·q=q·.(Mathematically,这与以下陈述相对应:·更准确地说,公理所说的是任何表达式q·q等于q·.

好啊,假设我们想从这个公理中得出····C·D(=)D·C····.我们可以用公理来转换D·CC·D··,最后C·D········C·D.

财务季度报表基本上是一样的,虽然它选择以稍微不同的顺序执行这些步骤,并修改左侧和右侧:

一个公理的不等式屋顶
γ

pf=findeQuantionalProof[(a\[centerdot]b)\[centerdot](c\[centerdot]d)\==(d\[centerdot]c)\[centerdot](b\[centerdot]a)、\!\(\*SubscriptBox[\(\[ForAll]\),\(p,Q \)]\(P \[CenterDot]Q==Q \[CenterDot]P \)\)[“校对笔记本”]

一旦有了这样的证据,只需完成每一步,并检查它们是否产生所声称的结果。但是怎样才能找到证据呢?有很多不同的可能的序列替换和转换那是可以做到的。那么,如何找到一个成功到达最终结果的序列呢?

有人可能会想:为什么不尝试所有可能的序列呢?如果有任何序列起作用,最终会有人找到它?好,问题是,一个人很快就会得到天文数字的可能的检查序列。事实上,主要自动定理证明的艺术包括寻找方法来修剪序列的数量,你必须检查。

This quickly gets pretty technical,但最重要的一点是,如果一个人知道基本代数,就很容易谈出来。徳赢彩票游戏假设你试图证明一个代数结果,比如:

证明的代数结果
γ

(-1+x^2)(1-x+x^2)(1+x+x^2)==(-1+x)(1+x+x^2)(1+x^3)

好,有一种有保证的方法可以做到这一点:只要应用代数规则来展开每一个边,就可以立即看到它们是相同的:

用Wolfram语言扩展代数结果
γ

展开[(-1+x^2)(1-x+x^2)(1+x+x^2)]展开[(-1+x)(1+x+x^2)(1+x^3)]

为什么会这样?好,这是因为有一种方法可以采用这样的代数表达式,并且总是有系统地减少它们,以便最终达到标准形式。好啊,但是对于任意公理系统的证明,我们能做同样的事情吗?

答案是:不是马上。它在代数中起作用,因为代数有一个特殊的性质,可以保证在减少表达式方面总是“取得进展”。但是在20世纪70年代独立发现了几次(名字像克努斯-班迪克斯以及Gr_bner基算法)即使一个公理系统本质上没有适当的性质,one can potentially find“完井”就是这样。

这就是由财务季度报表(基于Waldmeister(“树的主人”)系统)有所谓的“临界对引理”,它们本身并不直接“取得进展”。但要使设置路径成为可能。事情变得复杂的原因是,即使你想要表达的最后一句话相当简短,为了达到这个目的,我们可能需要遍历各种更长的中间表达式。所以,例如,为了证明上面的第一个谢弗公理,以下是中间步骤:

证明第一谢弗公理的中间步骤

在这种情况下,最大的中间形式大约是原始公理的4倍大。徳赢彩票游戏这里是:

谢菲尔德逻辑公理证明的最大中间形式
γ

(P \[CenterDot]Q)\[CenterDot](((P \[CenterDot]Q)\[CenterDo点](Q \[CenterDot]((Q \[Cente点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点整)((Q \[Cente点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点centerdot]((q \\[centerdot]q)\[centerdot]q)))\[centerdot](p\[centerdot]q)))\[centerdot](q\[centerdot]((q\[centerdot]q)\[centerdot]q))

我们可以用树来表示这样的表达式。这是一个,与原来的公理相比:

舍弗证明中最大中间公理(左)和原公理(右)的树形

下面是中间步骤的大小是如何通过为每一个谢夫公理找到的证明而演变的:

三个谢夫逻辑公理的证明中间步骤的大小

为什么这么难?

这些证据如此复杂,令人惊讶吗?在某些方面,不是真的。Because,毕竟,我们非常清楚数学可能很难。原则上,任何数学上正确的东西都很容易证明。但它的副作用之一是G_德尔定理从1931年开始,我们就要确定,即使我们最终能够证明的事情也可以有任意长的证据。

实际上,这是我所说的更普遍现象的症状违背了计算不可化归性.考虑一个受管理的系统,说,根据细胞自动机的简单规则(当然,每一个矿山论文一定在某个地方有一台细胞自动机!).现在运行系统:

证明计算不可约性的元胞自动机
γ

arrayplot[cellularautomaton[2007,3,1,randombinteger[23000],1500],frame->false,colorrules->0->white,1->hue[0.09,1、1.],2->Hue[0.03,1、0.76]}]

One might have thought that given that there's a simple rule that underlies the system,总会有一种快速的方法来确定系统将做什么。但事实并非如此。因为根据我的计算等效原理系统的操作通常对应于一个计算,这个计算和我们可以用来计算系统行为的任何计算一样复杂。这意味着系统的实际行为实际上对应着一个不可减少的计算量,我们无论如何都不能用捷径。

在上图中,假设我们想知道模式是否最终会消失。好,我们可以继续运行它,如果我们幸运的话,它最终会解决一些显而易见的问题。但总的来说,我们要走多远没有上限,实际上,证明发生了什么。

当我们做像上面逻辑证明这样的事情时,这是一个设置稍有不同.不是按照一定的规则来做,我们在问,是否存在一种方法,通过采取一系列步骤来达到特定的结果,每个步骤都遵循特定的规则。And,对,作为一个实际的计算问题,这一点立即变得更加困难。但问题的核心仍然是同样的计算不可约性现象,这一现象意味着没有任何通用的方法来简化计算系统将要做什么的过程。

不用说,世界上有很多东西,特别是在技术和科学建模方面,以及传统上为隐式避免计算不可约性而建立的各种形式法规的领域,并以其结果不需进行不可约简的计算就可轻易预见的方式运作。

但我的意思之一计算等效原理这是一种相当奇特和人为的情况,因为它说计算不可约性实际上普遍存在于计算宇宙中的各个系统中。

好啊,但是数学呢?徳赢彩票游戏也许数学规则是专门用来表示计算可约性的。确实有些情况是这样的(在某种意义上,它甚至发生在逻辑上)。但在大多数情况下,似乎数学公理系统并不是所有可能公理系统空间的不典型,在这些系统中,计算不可约性不可避免地猖獗。

什么是证据?

在某种程度上,证明的重点是要知道某件事是真的。当然,尤其是在现代,证据有很大的退路纯粹的计算。因为在实践中,想要通过显式计算生成事物比想要“返回”并构造一个证明事物是真的更为常见。

纯数学,虽然,至少处理那些名义上涉及无限多的案件(“所有素数都为真”,等)至少直接计算是行不通的。当涉及到验证问题时(“这个程序会崩溃吗?”或者“这种加密货币能花两次吗?”)尝试一个证据往往比处理所有可能的案件更合理。

但是在实际的数学实践中,要证明的不仅仅是确定事情是否属实。回到欧几里得第一次写他的时候元素,他刚刚给出了结果,证据“留给读者”。但无论好坏,尤其是上个世纪,证据已经成为不只是发生在幕后的事情,但事实上,它是应该通过的主要媒介。

在某种程度上,我认为今天的证据通常是为人类提供的,这是一个历史的怪癖,而程序通常被认为是计算机运行的东西。为什么会这样?好,至少在过去,证明实际上只能用文本形式来表示,所以如果要使用它们,它必须是人类的。但程序基本上都是用某种形式的计算机语言编写的。And for the longest time,这种语言往往被设置成相当直接地映射到计算机的低级操作上,这意味着计算机很容易“理解”这种语言,但不一定是人类。

但事实上,在过去的几十年里,我自己努力的主要目标之一就是改变这一现状,并在沃尔夫拉姆语一个真实的“计算通信语言“在这种情况下,计算思想可以以计算机和人类都容易理解的方式进行交流。

There are many consequences of having such a language.但其中之一就是它改变了证据的作用。Let's say one's looking at some mathematical result.好,在过去,唯一合理的沟通方式应该是证明人们可以阅读。但现在有了不同的可能性:一个人可以沃尔夫拉姆语计算结果的程序。在许多方面,这是一种更强有力的交流方式,解释为什么结果是真实的。因为程序的每一部分都是精确而明确的,如果你想,一个人真的可以跑。试着去理解某段文字的含义是没有问题的,也许可以填写一些隐含的假设。相反,一切都在那里,以绝对明确的形式。

好啊,那么证据呢?徳赢彩票游戏事实上,有没有明确和精确的方法来写证据?好,potentially yes,虽然不是特别容易。尽管沃尔夫拉姆的主要语言已经存在了30年,到目前为止,我们还需要找到一种合理的方法来表示它,即使是像上面的公理系统那样结构上相对简单的证明。

我们可以想象在沃尔夫拉姆语很像一个作者的程序,实际上我们正在研究如何提供这种“证明助手”功能的高级版本。但是我上面所展示的公理系统的证明并不是任何人所写的;是电脑发现的东西。因此,它更像是运行程序的输出,而不是程序本身。(就像一个节目,虽然,在某种意义上,证明可以是“运行”来验证结果。)

产生可理解性

大多数时候人们使用沃尔夫拉姆语-或沃尔夫拉姆阿尔法-他们只想计算东西。他们对取得成果感兴趣,不理解他们为什么得到结果。But in Wolfram|Alpha,尤其是在数学和化学领域,学生们最喜欢的特色是“逐步解决方案”

Wolfram Alpha中的逐步解决方案

什么时候?沃尔夫拉姆阿尔法比如计算一个积分,它使用各种强大的系统算法技术来获得答案。But when it's asked to show steps it needs to do something different: it needs instead to explain step by step why it gets the result it does.

解释它是如何得到结果的,这对它没有帮助;这是一个非常非人类的过程。相反,它基本上必须弄清楚人类所学的各种操作是如何被用来得到结果的。通常它会找出一些可以使用的技巧。对,会有一个系统的方法来做这件事,这总是有效的。但这涉及太多的“机械”步骤。“诀窍”(“trig substitution”,“分部集成”,无论如何)总的来说不起作用,但在这种情况下,它将提供一种更快的方法来得到答案。

好啊,但是要得到其他东西徳赢彩票游戏的可理解版本呢?就像程序的操作一般。或者像我公理体系的证明。

让我们从谈论程序开始。徳赢彩票游戏假设你写了一个程序,我们想解释一下它是如何工作的。一种传统的方法就是在代码中“包含注释”。好,如果一个人用传统的低级语言写作,那也许是最好的办法。但关键是沃尔夫拉姆语作为一种计算交流语言,语言本身应该允许你交流思想,不需要额外的英文文本。

这需要努力沃尔夫拉姆语节目是一个很好的展览,就像努力使英语文本成为一个很好的阐述一样。但最终可以得到一段Wolfram语言代码,这段代码非常清楚地解释了它是如何通过代码本身工作的。

当然,对于代码的实际执行来说,做一些仅仅从程序中无法预见的事情是很常见的。我将很快讨论像细胞自徳赢彩票游戏动机这样的极端情况。但现在,让我们设想一下,一个人构建了一个程序,在这个程序中,有一些能力预见它所做工作的大致轮廓。

在这种情况下,我发现计算论文(作为)Wolfram笔记本)是解释事情的好工具。关键是沃尔夫拉姆语是象征性的,因此,甚至可以单独运行任何程序的最小片段(使用适当的符号表达式作为输入或输出)。当你这样做的时候,你可以把程序中的一系列步骤作为构成计算笔记本核心的对话框中的一系列元素来呈现。

在实践中,创建输入或输出的可视化通常很关键。对,一切都可以用一个明确的符号表达式来表示。但我们人类在视觉上呈现事物时,往往会更容易理解,而不是像字符串这样的一维语言。

当然,创造良好的视觉效果是一门艺术。But in the沃尔夫拉姆语我们已经成功地使这门艺术自动化了很长一段时间,我们经常使用相当复杂的机器学习和其他算法来完成诸如布局网络或图形元素之类的工作。

从程序的原徳赢彩票游戏始执行跟踪开始怎么样?好,这很难。我做了几十年的实验,对结果也从未感到满意。对,你可以放大查看正在发生的事情的很多细节。但说到了解“大局”,我从来没有找到任何特别好的技术来自动生成非常有用的东西。

在某种程度上,它类似于逆向工程的一般问题。你会看到一些最终的机器代码,芯片设计或者什么。但现在你要回溯到重建一些人类开始的更高层次的描述,不知何故,这就是你所看到的。

在传统的工程方法中,当一个人逐渐积累东西的时候,总是能够以某种方式预见自己所建造的东西的后果,这种方法原则上是可行的。但如果一个人只是搜索计算宇宙为了找到一个最佳的程序(就像我搜索可能的AXIOM系统来寻找逻辑程序一样)。那么就不能保证这个计划背后有任何“人类故事”或解释。

这是自然科学中的一个类似问题。你看到一些复杂的事情发生在生物系统.一个“逆向工程”能为他们找到一个“解释”吗?有时人们可能会说,例如,自然选择的进化可能会导致一些事情。或者它在计算宇宙中很常见,所以很可能发生。但不能保证自然世界是以任何方式建立起来的,这必然会让人类作出解释。

不用说,当一为事物制作模型,人们不可避免地只考虑自己感兴趣的特定方面,把其他一切理想化。尤其是在医学领域,最终得到一个很容易解释的、相当浅的决策树的近似模型并不少见,至少到目前为止。

可解释性的本质

说什么东西可以解释是什么意思?基本上是人类可以理解的。

那么人类理解某件事需要什么呢?好,不知何故,我们必须能够“把我们的大脑包围起来”。让我们来看一个具有复杂行为的典型细胞自动机。计算机在进化的每一步中都没有问题。通过巨大的努力,人类可以费力地复制计算机的功能。

但人们不会说这意味着人类“了解”细胞自动机在做什么。为了达到这个目的,人类必须能够很容易地解释细胞自动机的行为,徳赢彩票游戏在某种程度上。或者换个说法,人类必须能够“讲一个故事”,其他人很容易理解,徳赢彩票游戏关于细胞自动机的行为。

有一般的方法吗?好,不,因为违背了计算不可化归性.但人类选择关心的某些特征仍然可以用一些简化的方法来解释,徳赢彩票游戏更高层次的方式。

这是怎么工作的?好,在某种意义上,它要求构建一些更高级的语言来描述你感兴趣的特性。看看典型的细胞自动机模式,我们可以试着不谈大量单个细胞的颜色,但相反,在高层建筑一个人可以挑出。关键是,至少可以对这些结构做一个部分的目录:尽管有很多细节不太合适,仍然有一些特殊的结构经常发生。

如果我们要开始解释细胞自动机的行为,我们通常从给出结构名称开始,然后我们就开始讨论这些命名的事物到底发生了什么。徳赢彩票游戏

细胞自动机输出中的命名结构

元胞自动机的例子有一个有趣的简化特性:因为它是按照简单的确定规则操作的,有些结构只是重复相同。If we're dealing with things in the natural world,例如,我们通常不会看到这种重复。相反,it'll just be that this tiger,说,和另一个非常相似,所以我们可以称它们为“老虎”,即使它们的原子排列不相同。

事情的大局是什么?好,基本上,我们使用的是符号表示的概念。我们的意思是,我们可以指定一个词来象征性地描述一类事物,不必总是谈论每件事的所有细节部分。徳赢彩票游戏

实际上,这是一种信息压缩:我们使用符号构造来寻找一种较短的方法来描述我们感兴趣的内容。

让我们想象一下,我们创造了一个巨大的结构,说一个数学的:

Wolfram语言中的巨大数学结构
γ

求解[a x^4+b x^3+c x^2+d x+e==0,X]

好,第一步是生成一种内部的高层表示。例如,我们可能会发现重复出现的子结构。然后我们可以给它们命名。然后根据这些名称显示整个结构的“骨架”:

一

And,对,这种“字典压缩“–类似的方案有助于实现第一层次的可解释性。

但让我们回到我的公理系统的证明。在这个证明中生成的引理被精确地设置为重复使用的元素(有点像共享的公共子表达式)。但即使事实上把他们排除在外,我们仍然有一个证据,证明我们人类并不容易理解。

那么,我们如何才能走得更远呢?好,基本上,我们必须提出一些更高层次的描述。但这可能是什么?

概念的概念

如果你想向某人解释一些事情,如果有类似的东西他们已经理解了,那就容易多了。Imaginetrying to explain a modern drone送给石器时代的人。这可能相当困难。但50年前给别人解释过,谁见过直升机、飞机模型等?会容易得多。

And ultimately the point is that when we explain something,我们用某种语言来做这件事,无论是我们还是我们要解释它的人。这种语言越丰富,为了传达我们试图解释徳赢中国的内容,我们引入的新元素越少。

有一种模式在整个知识史上重复出现。有些特别的收藏品经常被人看到。渐渐地,人们理解这些事物都是抽象相似的。它们都可以用一些特殊的新概念来描述,徳赢中国常被一些新词或短语所指。徳赢中国

Let's say one had seen things like water and blood and oil.好,at some point one realizes that there's a general concept of "liquid",所有这些都可以描述为液体。一旦有了这个概念,我们可以从中开始推理,确定更多的概念,比如,说,它的粘性。

什么时候把事物组合成一个概念是有意义的?好,这是个难题,如果没有预见到这一概念所能实现的一切,就无法最终得到答案。实际上,在人类语言和思想的进化过程中,有一种渐进的近似过程在继续。

有一个更快速的概括发生在现代机器学习系统。想象一下,带着人们在世界上看到的各种物体,把它们喂给特征空间图看看会发生什么。好,如果在特征空间中有明确的簇,那么,我们可以合理地认为,这些集群中的每一个都应该被标识为对应于一个“概念”,例如,我们可以用一个词作为标签。

现在,说句公道话,发生什么事了特征空间图-就像人类的智力发展在某些方面是渐进的。因为要将对象放在要素空间中,特征空间图is using features that it's learned how to extract from previous categorizations it knows 徳赢彩票游戏about.

但是,好啊,鉴于世界现状,你能用什么最好的分类或概念来描述事物?好,这是一个不断发展的故事。事实上,无论是在科学上,技术或其他地方常常与认识到一些新的类别或概念可以被有效地识别这一点密切相关。徳赢中国

但在我们文明的实际演变中,there's a kind of spiral at work.首先确定了一些特定的概念,比如程序的概念。一旦确定了一些概念,人们开始使用它,从这个角度思考。很快,各种各样的新事物都建立在这个概念的基础上。徳赢中国但随后又确定了另一个抽象层次,新概念的徳赢中国构建,建立在前一个之上。

对于现代文明的技术堆栈来说,情况差不多是一样的,以及它的“智力堆栈”。两者都涉及概念塔,以及连续的抽象层次。

教育问题

为了让人们能够使用某种概念进行交流,they have to have learned 徳赢彩票游戏about it.And,对,有一些概念(比如物体的永久性)是人类通过观察自然世界自动学习的。但举个例子常用词列表在现代英语中,很明显,我们现在在现代文明中使用的大多数概念并不是人们可以从自然世界中为自己学习的概念。

相反,他们更像一个现代机器学习系统,至少他们需要一些“特别策划”的世界经验,组织以突出特定概念。And for more abstract areas (like mathematics) they probably need explicit exposure to the concepts themselves in their raw abstract forms.

但是,好啊,随着文明“知识栈”的发展,我们总是需要不断地学习吗?我们可能担心在某个时刻我们的大脑无法跟上,我们必须增加一些增强。但也许幸运的是,我认为这是其中一种情况,在这种情况下,问题很可能“在软件中解决”。

问题是:在历史的任何时刻,有一套特定的概念对于能够像当时那样在世界上运作是很重要的。And,对,随着文明的进步,新事物被发现,徳赢中国引入了新徳赢中国的概念。但也有另一个过程在起作用:新概念带来了新的抽象层次,徳赢中国它通常包含大量早期概念。

我们经常在技术上看到这一点。曾经有一段时间,操作一台你需要知道各种低级细节的计算机。但随着时间的推移,这些被抽象了,所以你只需要知道一些一般的概念。你点击一个图标,事情就开始发生,你不需要了解操作系统,或中断处理程序或调度程序,或者任何这些细节。

不用说,这个沃尔夫拉姆语提供了一个很好的例子。因为它给自动化输出“很多低级的细节(例如使用什么特定的算法),让人类用户从高级概念的角度来思考问题。徳赢彩票游戏

对,仍然需要有一些人理解抽象“底层”的细节(尽管我不确定现代社会需要多少燧石敲击者)。但大多数教育可以集中在更高层次的教学上。

教育中经常有一个隐含的假设,即要达到更高层次的概念,就必须以某种方式重述这些概念历史上是如何产生的。但通常情况下,也许总是这样,这似乎不是真的。在极端情况下,我们可以想象,教计算机,徳赢彩票游戏我们必须重述数学逻辑的历史。但事实上我们知道人们可以直接现代计算概念,没有重述历史。

但最终什么是可理解的概念网络?有没有只有当一个人已经了解其他概念时才能理解的概念?考虑到人类的特定环境体验(或神经网络的特定背景训练),可能会有一些排序。

但我怀疑,类似于计算普遍性的东西可能意味着,如果你只是处理一个“原始大脑”,那么你可以从任何地方开始。所以,如果有外星人从一开始就接触到了范畴理论,而其他的很少,毫无疑问,他们会建立一个概念网络,从根本上来说,对我们来说,基本的算术也许只有在他们的数学研究生院里才能达到。

当然,这样的外星生物可能以一种与我们完全不同的方式形成他们的技术堆栈和他们的建筑环境,正如如果计算机成功开发,我们自己文明的最新历史可能会非常不同。在19世纪而不是在20世纪中期。

数学的进步

我经常想知道人类数学的历史轨迹在多大程度上是一个“意外”,在某种程度上,这是不可避免的。正如我之前提到的,在形式系统的层次上,有许多可能的公理系统,人们可以从中构造某种形式上类似数学的东西。

但实际的数学史并不是从任意公理系统开始的。它始于巴比伦时代,致力于使用商业算术和土地测量的几何学。从这些非常实际的起源,不断增加的抽象层最终导致了现代数学,例如广义数从正整数,合理化,根,对于所有整数,小数,对于复数,代数数,四元数等等。

抽象的发展是否有必然性?我怀疑在某种程度上有。这可能是一个类似于其他类型的概念形成的故事。考虑到已经达到的阶段,有很多东西很容易学习,一段时间后,他们中的一组被看作是更一般和抽象的结构的例子,然后又定义了另一个研究新事物的阶段。徳赢中国

有没有办法打破这种循环?一种可能是通过做数学实验。对,我们可以系统地证明关于特定数学系统的事情。徳赢彩票游戏但是我们也可以通过经验来注意数学事实,比如拉马努詹的观察结果经验[Pi Sqrt[163]数值上接近整数。问题是:像这样的事情仅仅是“数学的随机事实”,还是它们在某种程度上符合整个“数学结构”?

关于数学中的问题,人们可以问同样的问题。徳赢彩票游戏问题是奇数是否存在(毕达哥拉斯之后一直没有答案)数学的核心问题,或者是,从某种意义上说,一个与数学结构无关的随机问题?

就像一个人能列举出诸如公理系统之类的东西,所以我们也可以想象在数学中列举可能的问题。但如果有人这样做,我怀疑马上就有问题了。G_德尔定理establishes that in axiom systems like the one for arithmetic there are "formally undecidable" propositions,这在公理体系中是无法证明或否定的。

但是G_del构造的特殊例子似乎与数学中自然产生的任何东西都大相径庭。很长一段时间以来,人们一直认为,不知何故,不可决定的现象是,虽然原则上存在,wasn't going to be relevant in "real mathematics".

然而,和我一起计算等效原理我在计算领域的经验,I've come to the strong conclusion that this isn't correct—and that instead不确定性实际上就在眼前即使是在已经实践过的典型数学中。的确,如果有一小部分当前著名的尚未解决的数学问题(黎曼假设,P=NP等。)事实证明,事实上是无法决定的。

但如果周围都有不确定因素,为什么会有这么多的数学已经成功地完成了呢?好,我认为这是因为所做的事情都是为了避免不确定,基本上就是靠数学的建立。因为如果一个人所做的基本上是基于所展示的事物形成渐进的抽象层次,一个人基本上建立了一条能够在不被强迫做出不可决定的情况下前进的道路。

当然,做实验数学或者问“随机问题”,可能会立即把一个落在某个充满不确定性的地方。但至少到目前为止,这并不是数学主流学科发展的方式。

那么那些“数学的徳赢彩票游戏随机事实”呢?好,这与智力活动的其他领域非常相似。“随机事实”并没有真正融入到智力发展的一条线中,直到在它们周围建立了一些结构和通常是一些抽象概念。

我自己最喜欢的关于复杂度起源的发现,如Rule30细胞自徳赢彩票游戏动机。是个很好的例子.对,类似的现象也曾出现过。-甚至几千年前(想想:素数序列的随机性)但如果没有一个更广泛的概念框架,没有人真正关注它们。

Nested patterns是另一个例子。在12世纪的马赛克,但直到20世纪80年代,筑巢和分形的整个框架出现之前,没有人真正关注它们。

这是一个又一个相同的故事:直到他们周围的抽象概念被识别出来,很难真正考虑新事物,徳赢中国徳赢彩票游戏即使一个人遇到了展示他们的现象。

所以,我怀疑,数学就是这样:在定义数学轨迹的抽象概念之上,必然会有某种抽象概念的分层。这是一条独特的道路吗?当然不是。在可能的数学事实的广阔空间里,有一些特别的方向可以选择,并继续发展。但其他人可能会被选中。

那么,这是否意味着数学的主题不可避免地被历史事故所支配?不像人们想象的那么多。因为随着数学一次又一次的发现,starting with things like algebra and geometry—there's a remarkable tendency for different directions and different approaches to wind up having equivalences or correspondences in the end.

可能在某种程度上,这是计算等效原理,计算普遍性的现象:即使在数学的不同领域使用的基本规则(或基本“语言”)是不同的,最终会有某种方法在它们之间进行转换,以便在下一个抽象层次上,所采取的路径不再是至关重要的。

逻辑证明与抽象的自动化

好啊,那么让我们回到逻辑证明。How does it connect to typical mathematics?好,马上,基本上没有。对,证明具有与标准数学证明相同的名义形式。但它不是“对人类数学家友好的”。这些都只是机械方面的细节。It doesn't connect to higher-level abstract concepts that a human mathematician can readily understand.

如果我们发现证明中的非平凡引理已经出现在数学文献中.(我不认为他们中的任何一个这样做,但是我们的定理搜索能力还没有达到可以确定的程度。)但是如果它们确实出现了,这样我们就可以把这些引理和数学中的其他东西联系起来,事实上,他们周围有一圈抽象概念。

但如果没有这个,怎样才能解释这个证据?

好,也许有一种不同的方法来证明这与现有的数学有着本质上的联系。但即使我们现在有了证据,我们可以想象“构建”新概念,它将定义更高级别的抽象,并将证明放在更徳赢中国一般的上下文中。

我不知道该怎么做。我考虑过赞助一个奖项(类似于2007图灵机器奖) for "making the proof explainable".But it's not at all clear how one could objectively judge "explainability".(也许你可以要求一个1小时的视频来成功地向一个典型的数学家解释这个证明,但这绝对是相当主观的。)

但就像我们可以自动化一样寻找网络的美学布局,也许我们可以自动化证明过程。现在的证据基本上只是说(没有解释)。“想想这几百个柠檬”。但是假设我们可以识别出一些“有趣的”引理。也许我们可以把这些加到我们的数学经典中,然后用它们来理解证明。

这里有个比喻语言设计.在建立沃尔夫拉姆语我所做的基本上是试图识别出人们通常想要的“计算工作块”。然后我们把它们做成语言中的内置函数,用人们可以用来指代它们的特殊名称。

不过,在人类自然语言的进化过程中,也有一个类似的过程以一种不那么有组织的方式进行着。“意义块”最终被证明是有用的,在语言中用词来表示。有时,它们以一些现有单词构成的短语开始。但最具影响力的词通常与之前出现的词相距甚远,它们只是作为新词出现,可能很难给出定义。徳赢中国

在设计中沃尔夫拉姆语-用英文单词命名的函数-我的杠杆作用来自英语单词的“环境理解”(有时也源于它们在常用计算中的含义)。

我们想做一些类似的事情来识别引理来加入我们的数学经典。不仅要确保每一个引理都是“本质上有趣的”,但是,如果可能的话,我们也希望从现有的已知数学结果和概念中选择“容易到达”的引理。

但是对于一个引理来说,“本质有趣”是什么意思呢?在我工作之前我必须说A 徳赢中国New Kind of Science,我认为在数学的任何特定领域中选择引理(或定理)都存在很大的随意性和历史偶然性,这些引理在典型的教科书中都被引用和命名。

但当我详细研究基本逻辑中的定理时,我很惊讶地发现不同的东西.让我们假设一个按照基本逻辑的大小排列所有的真定理(例如=可能先到;=稍晚一点,等等。当一个人浏览这个列表时,会有很多冗余。的确,大多数定理最终都是已经出现在列表中的定理的平凡扩展。

But just sometimes one gets to a theorem that essentially gives 徳赢中国new information—and that can't be proved from the theorems that have already appeared in the list.值得注意的事实是:14个这样的定理,它们本质上与逻辑教科书中给出的定理完全一致。(Here是,是,和不是是)

命名逻辑定理是提供新信息的定理。徳赢中国

换言之,至少在这种情况下,命名的或“有趣的”定理是给出新信息最小语句的定理。徳赢中国(是的,过了一会儿,根据这个定义,不会有新的信息,徳赢中国because one will have encountered all the axioms needed to prove anything that can be proved—though one can go a bit further with this approach by starting to discuss limiting the complexity of proofs that are allowed.)

What 徳赢彩票游戏about with与非门定理,像证据里的那些?再一次,一能arrange all true 与非门有序定理-然后找出其中哪一个不能从列表中的任何较早部分得到证明:

给出新信息的NAND逻辑定理徳赢中国
γ

{{a\[CenterDot]b==b\[CenterDot]a,a==(a\[CenterDot]a)\[CenterDot](a\[CenterDot]a),a==(a\[CenterDot]a)\[CenterDot](a\[CenterDot]b),(a\[CenterDot]a)\[CenterDot]a==(b\[CenterDot]b)\[CenterDot]b,(a\[CenterDot]a)\[CenterDot]b==(a\[CenterDot]b)\[CenterDot]b,a\[CenterDot]((a\[CenterDot]b)\[CenterDot]c)==a\[CenterDot]((b\[CenterDot]b)\[CenterDot]c)},{a\[CenterDot]b==b\[CenterDot]a,a==(a\[CenterDot]a)\[CenterDot](a\[CenterDot]a),a==(a\[CenterDot]a)\[CenterDot](a\[CenterDot]b),a==(a\[CenterDot]a)\[CenterDot](b\[CenterDot]a),a==(a\[CenterDot]b)\[CenterDot](a\[CenterDot]a),a==(b\[CenterDot]a)\[CenterDot](a\[CenterDot]a),(a\[CenterDot]a)\[CenterDot]a==a\[CenterDot](a\[CenterDot]a),(a\[CenterDot]a)\[CenterDot]a==(b\[CenterDot]b)\[CenterDot]b,a\[CenterDot](a\[CenterDot]a)==(b\[CenterDot]b)\[CenterDot]b,(a\[CenterDot]a)\[CenterDot]a==b\[CenterDot](b\[CenterDot]b),a\[CenterDot](a\[CenterDot]a)==b\[CenterDot](b\[CenterDot]b),a\[CenterDot](a\[CenterDot]b)==(a\[CenterDot]b)\[CenterDot]a,a\[CenterDot](a\[CenterDot]b)==a\[CenterDot](b\[CenterDot]a),(a\[CenterDot]a)\[CenterDot]b==(a\[CenterDot]b)\[CenterDot]b,a\[CenterDot](a\[CenterDot]b)==a\[CenterDot](b\[CenterDot]b),a\[CenterDot](a\[CenterDot]b)==(b\[CenterDot]a)\[CenterDot]a,(a\[CenterDot]a)\[CenterDot]b==b\[CenterDot](a\[CenterDot]a),(a\[CenterDot]a)\[CenterDot]b==(b\[CenterDot]a)\[CenterDot]b,(a\[CenterDot]a)\[CenterDot]b==b\[CenterDot](a\[CenterDot]b),a\[CenterDot](a\[CenterDot]b)==(b\[CenterDot]b)\[CenterDot]a,(a\[CenterDot]a)\[CenterDot]b==b\[CenterDot](b\[CenterDot]a),(a\[CenterDot]b)\[CenterDot]a==a\[CenterDot](b\[CenterDot]a),(a\[CenterDot]b)\[CenterDot]a==a\[CenterDot](b\[CenterDot]b),a\[CenterDot](b\[CenterDot]a)==a\[CenterDot](b\[CenterDot]b),(a\[CenterDot]b)\[CenterDot]a==(b\[CenterDot]a)\[CenterDot]a,a\[CenterDot](b\[CenterDot]a)==(b\[CenterDot]a)\[CenterDot]a,(a\[CenterDot]b)\[CenterDot]a==(b\[CenterDot]b)\[CenterDot]a,a\[CenterDot](b\[CenterDot]a)==(b\[CenterDot]b)\[CenterDot]a,a\[CenterDot](b\[CenterDot]b)==(b\[CenterDot]a)\[CenterDot]a,(a\[CenterDot]b)\[CenterDot]b==b\[CenterDot](a\[CenterDot]a),(a\[CenterDot]b)\[CenterDot]b==(b\[CenterDot]a)\[CenterDot]b,(a\[CenterDot]b)\[CenterDot]b==b\[CenterDot](a\[CenterDot]b),a\[CenterDot](b\[CenterDot]b)==(b\[CenterDot]b)\[CenterDot]a,(a\[CenterDot]b)\[CenterDot]b==b\[CenterDot](b\[CenterDot]a),a\[CenterDot](b\[CenterDot]c)==a\[CenterDot](c\[CenterDot]b),(a\[CenterDot]b)\[CenterDot]c==(b\[CenterDot]a)\[CenterDot]c,a\[CenterDot](b\[CenterDot]c)==(b\[CenterDot]c)\[CenterDot]a,(a\[CenterDot]b)\[CenterDot]c==c\[CenterDot](a\[CenterDot]b),a\[CenterDot](b\[CenterDot]c)==(c\[CenterDot]b)\[CenterDot]a,(a\[CenterDot]b)\[CenterDot]c==c\[CenterDot](b\[CenterDot]a),(a\[CenterDot]a)\[CenterDot](a\[CenterDot]a)==(a\[CenterDot]a)\[CenterDot](a\[CenterDot]b),(a\[CenterDot]a)\[CenterDot](a\[CenterDot]a)==(a\[CenterDot]a)\[CenterDot](b\[CenterDot]a),(a\[CenterDot]a)\[CenterDot](a\[CenterDot]a)==(a\[CenterDot]b)\[CenterDot](a\[CenterDot]a),(a\[CenterDot]a)\[CenterDot](a\[CenterDot]a)==(b\[CenterDot]a)\[CenterDot](a\[CenterDot]a),(a\[CenterDot]a)\[CenterDot](a\[CenterDot]b)==(a\[CenterDot]a)\[CenterDot](a\[CenterDot]c),(a\[CenterDot]a)\[CenterDot](a\[CenterDot]b)==(a\[CenterDot]a)\[CenterDot](b\[CenterDot]a),(a\[CenterDot]a)\[CenterDot](a\[CenterDot]b)==(a\[CenterDot]a)\[CenterDot](c\[CenterDot]a),(a\[CenterDot]a)\[CenterDot](a\[CenterDot]b)==(a\[CenterDot]b)\[CenterDot](a\[CenterDot]a)},{a\[CenterDot]((a\[CenterDot]b)\[CenterDot]b)==(c\[CenterDot](a\[CenterDot]a))\[CenterDot]a,a\[CenterDot]((a\[CenterDot]b)\[CenterDot]b)==((c\[CenterDot]a)\[CenterDot]c)\[CenterDot]a,a\[CenterDot]((a\[CenterDot]b)\[CenterDot]b)==(c\[CenterDot](a\[CenterDot]c))\[CenterDot]a,(a\[CenterDot](a\[CenterDot]b))\[CenterDot]b==(c\[CenterDot](b\[CenterDot]b))\[CenterDot]b,(a\[CenterDot](a\[CenterDot]b))\[CenterDot]b==((c\[CenterDot]b)\[CenterDot]c)\[CenterDot]b,(a\[CenterDot](a\[CenterDot]b))\[CenterDot]b==(c\[CenterDot](b\[CenterDot]c))\[CenterDot]b,a\[CenterDot]((a\[CenterDot]b)\[CenterDot]b)==(c\[CenterDot](c\[CenterDot]a))\[CenterDot]a,(a\[CenterDot](a\[CenterDot]b))\[CenterDot]b==(c\[CenterDot](c\[CenterDot]b))\[CenterDot]b,a\[CenterDot]((a\[CenterDot]b)\[CenterDot]b)==((c\[CenterDot]c)\[CenterDot]c)\[CenterDot]a,a\[CenterDot]((a\[CenterDot]b)\[CenterDot]b)==(c\[CenterDot](c\[CenterDot]c))\[CenterDot]a,(a\[CenterDot](a\[CenterDot]b))\[CenterDot]b==((c\[CenterDot]c)\[CenterDot]c)\[CenterDot]b,(a\[CenterDot](a\[CenterDot]b))\[CenterDot]b==(c\[CenterDot](c\[CenterDot]c))\[CenterDot]b,a\[CenterDot](a\[CenterDot](b\[CenterDot]c))==a\[CenterDot](a\[CenterDot](c\[CenterDot]b)),(a\[CenterDot](a\[CenterDot]b))\[CenterDot]c==((a\[CenterDot]b)\[CenterDot]a)\[CenterDot]c,(a\[CenterDot](a\[CenterDot]b))\[CenterDot]c==(a\[CenterDot](b\[CenterDot]a))\[CenterDot]c,a\[CenterDot]((a\[CenterDot]b)\[CenterDot]c)==a\[CenterDot]((b\[CenterDot]a)\[CenterDot]c),((a\[CenterDot]a)\[CenterDot]b)\[CenterDot]c==((a\[CenterDot]b)\[CenterDot]b)\[CenterDot]c,(a\[CenterDot](a\[CenterDot]b))\[CenterDot]c==(a\[CenterDot](b\[CenterDot]b))\[CenterDot]c,a\[CenterDot]((a\[CenterDot]b)\[CenterDot]c)==a\[CenterDot]((b\[CenterDot]b)\[CenterDot]c),a\[CenterDot]((a\[CenterDot]b)\[CenterDot]c)==((a\[CenterDot]b)\[CenterDot]c)\[CenterDot]a,a\[CenterDot](a\[CenterDot](b\[CenterDot]c))==(a\[CenterDot](b\[CenterDot]c))\[CenterDot]a,a\[CenterDot](a\[CenterDot](b\[CenterDot]c))==a\[CenterDot]((b\[CenterDot]c)\[CenterDot]a),a\[CenterDot](a\[CenterDot](b\[CenterDot]c))==((a\[CenterDot]b)\[CenterDot]c)\[CenterDot]c,(a\[CenterDot](a\[CenterDot]b))\[CenterDot]c==(a\[CenterDot](b\[CenterDot]c))\[CenterDot]c,a\[CenterDot]((a\[CenterDot]b)\[CenterDot]c)==a\[CenterDot]((b\[CenterDot]c)\[CenterDot]c),a\[CenterDot]((a\[CenterDot]b)\[CenterDot]c)==a\[CenterDot](c\[CenterDot](a\[CenterDot]b)),a\[CenterDot](a\[CenterDot](b\[CenterDot]c))==(a\[CenterDot](c\[CenterDot]b))\[CenterDot]a,a\[CenterDot](a\[CenterDot](b\[CenterDot]c))==a\[CenterDot]((c\[CenterDot]b)\[CenterDot]a),a\[CenterDot]((a\[CenterDot]b)\[CenterDot]c)==a\[CenterDot](c\[CenterDot](b\[CenterDot]a)),a\[CenterDot](a\[CenterDot](b\[CenterDot]c))==((a\[CenterDot]c)\[CenterDot]b)\[CenterDot]b,a\[CenterDot]((a\[CenterDot]b)\[CenterDot]c)==a\[CenterDot](c\[CenterDot](b\[CenterDot]b)),((a\[CenterDot]a)\[CenterDot]b)\[CenterDot]c==((a\[CenterDot]c)\[CenterDot]b)\[CenterDot]c,(a\[CenterDot](a\[CenterDot]b))\[CenterDot]c==(a\[CenterDot](c\[CenterDot]b))\[CenterDot]c,a\[CenterDot]((a\[CenterDot]b)\[CenterDot]c)==a\[CenterDot]((c\[CenterDot]b)\[CenterDot]c),a\[CenterDot]((a\[CenterDot]b)\[CenterDot]c)==a\[CenterDot](c\[CenterDot](b\[CenterDot]c)),a\[CenterDot]((a\[CenterDot]b)\[CenterDot]c)==a\[CenterDot](c\[CenterDot](c\[CenterDot]b))}}

与非门历史传统与不是.(和)似乎没有任何人类语言那,例如,只有一个普通的词与非门但是在与非门定理,第一个突出显示的是很容易识别的交换性与非门.之后,one really has to do a bit of translation to name the theorems:=(·····就像双重否定定律,=(·····就像吸收定律,·=(····Bis like "weakening",等等。

但是,好啊,所以如果你只想学习与非门逻辑,它们应该是什么?也许它们应该是证明中作为“流行引理”出现的定理。

当然,任何给定定理都有许多可能的证明。但我们只是使用特定的证据财务季度报表生成。结果证明在前一千个的证据中与非门定理最流行的一个引理是·=·()·,其次是柠檬·()·)····(·()·)=).

这些是什么?好,对于特定的方法财务季度报表使用,它们很有用。但对我们人类来说,它们似乎没有太大的帮助。

But what 徳赢彩票游戏about popular lemmas that happen to be short?·=·绝对不是最流行的引理,但它是最短的。·····=更受欢迎,但是更长。还有柠檬·····=.

但是这些柠檬有多有用呢?这是一种测试方法。看看前一千个与非门定理,并且看看增加了多少引理缩短了这些定理的证明(至少由财务季度报表):

前千个NAND定理证明中的每一个都通过加上引理而缩短的量

·=·非常成功,经常把证据减少近100步。·····=成功率要低得多;事实上,事实上,有时它似乎“混淆”财务季度报表,使其采取更多而不是更少的步骤(在绘图中显示为负值)。·····=可以缩短,但不如·=·.但是如果把它和·=·,结果是缩短更加一致。

我们可以继续这个分析,比如包括一个给定引理产生的缩短量的比较,相对于它自己的证据有多长时间。但问题是,如果一个添加了几个“有用的引理”,喜欢·=······=,仍然有大量的长期证据,因此还有很多需要“理解”的地方:

添加有用引理后的长证明

你能理解什么?

有不同的方法来创建事物模型。几百年来,精确的科学是由寻找数学方程的想法主导的,这些方程可以用来解释事物的行为。但在差不多的时间A 徳赢中国New Kind of Science出现,有一个强劲的转变相反,设置可以运行的程序来说明应该如何操作。

有时,这些程序是为特定目的而显式构造的;有时他们会被彻底搜查。And in modern times,至少有一类这样的程序是通过机器学习推导出来的,基本上是从已知系统行为的例子中向后看。

好啊,所以有了这些不同的建模形式,“明白发生了什么事”有多容易?用数学方程,当有可能找到一个“精确解”的时候,这是一个很大的优势——在这个解中,系统的行为可以用一个明确的数学公式来表示。即使这种情况没有发生,至少能够做出一些抽象到足以连接到其他系统和其他行为的数学陈述是很常见的。

如上所述,with a program—like a cellular automaton—it can be a different story.因为很常见的一种情况是立即被推到计算不可约性中,这最终限制了人们希望走捷径或“解释”到底发生了什么。

但是机器学习呢?徳赢彩票游戏而且,说,用神经网络?在某种程度上,神经网络的训练就像是自然科学中归纳发现的重演。一个人试图从例子开始,为一个系统的行为推导一个模型。但那我们能理解这个模型吗?

还有计算不可约性的问题。但让我们来谈谈一个我们至少可以徳赢彩票游戏想象一下理解正在发生的事情会是什么样子的情况。

不是用神经网络来模拟某些系统的行为,我们考虑做一个对世界某些方面进行分类的神经网络说,拍摄图像并对其进行分类根据他们的形象(“船”,“长颈鹿”等等)。当我们训练神经网络时,它正在学习给出正确的最终输出。但是,有可能人们会想到这样做的方式,即在内部做出一系列区别(有点像玩一个20个问题的游戏),最终确定正确的输出。

但是这些区别是什么?有时候我们可以认出他们中的一些人。“图像中有很多蓝色吗?”,例如。但大多数时候,它们本质上是我们人类没有注意到的世界的特征。也许有另一种自然科学的历史,其中一些会出现。但它们不是我们现在生活的一部分感知或分析的准则.

如果我们想添加它们,我们可能最终会为他们发明词汇。但这种情况与有逻辑证明的情况非常相似。一个自动化的系统已经创造了一些东西,它可以有效地作为生成结果的“路径点”。但它们不是我们认识或联系的路标。

再一次,如果我们发现神经网络的特殊区别非常普遍,我们可能认为这些区别值得我们人类学习,在我们的标准规范中增加了描述世界的方法。

我们能指望这样一个适度的区别会有很长的路要走吗?这类似于询问少量的定理在理解逻辑证明之类的东西时是否会有很长的路要走。

我猜答案是模糊的。If one looks,例如,在一大量数学论文集,我们可以问,不同的定理有多普遍。结果证明,定理的频率几乎是完美的。Zipf law(与中心极限定理,这个隐函数定理富比尼定理作为前三名)。这可能与“值得知道”的区别相同,或者“徳赢中国值得知道”的新定理。

知道一些人会有一定距离,但是会有一个无限的幂律尾,一个人永远不会走到尽头。

知识的未来

无论是看数学,科学或技术,我们可以看到构建一个不断增加的抽象堆栈的基本定性过程。能够量化这个过程是很好的。也许我们可以看看某些常见的术语或描述是如何被包含进更高层次的抽象中的,然后又有新的相关术语或描述。徳赢中国

也许我们可以用某种形式的计算模型来建立这个过程的理想化模型,喜欢图灵机.假设在最底层有一个基本的图灵机,没有抽象。现在想象一下,根据定义的随机过程为这个图灵机选择程序。然后运行这些程序并对它们进行分析,看看什么“更高级”的计算模型可以成功地重现这些程序的聚合行为,而无需在每个程序中运行每个步骤。

人们可能会认为计算不可约性意味着这种更高层次的计算模型在构造上必然会更加复杂。但关键是我们只想复制程序的聚合行为,不是他们的个人行为。

好啊,但是,如果你重复这个过程,从本质上重述理想化的人类知识史,并建立一个渐进的抽象塔,会发生什么呢?

可以想象,在物理学中有一些与临界现象的类比,以及对重整化群.如果是这样,我们可以想象,能够在概念表示框架的空间中确定一个确定的轨迹。轨道会做什么?

Maybe it'll have some kind of fixed-point behavior,代表着在历史的任何一点上都有同样数量的抽象概念值得学习,而新概念正慢慢被发明,徳赢中国徳赢彩票游戏旧的被纳入。

这对数学意味着什么?一种猜测可能是任何“数学的随机事实”,从经验上说,would eventually be covered when some level of abstraction is reached.It's not obvious how this process would work.毕竟,在任何给定的抽象层次上,there are always 徳赢中国new empirical facts to be "jumped to".很可能“上升的抽象潮”只会比这种跳跃的速度移动得慢。

理解的未来

好啊,那么,这一切对理解的未来意味着什么呢?

过去,when humans looked,说,在自然世界,他们没有多少借口去理解它。有时他们会拟人化它的某些方面的精神或神灵。但他们认为这只是一种表现,没有任何可能让人类详细了解原因。

但是随着现代科学的兴起,特别是随着我们日常生活中越来越多的东西出现在由我们设计的技术(或监管结构)主导的建筑环境中,这些期望值也随之改变。当我们今天看计算或者人工智能的时候,我们可能无法理解这一点,这似乎令人不安。

但最终,我们世界上的系统之间总会有竞争,以及我们的大脑对它们的计算能力。徳赢彩票游戏如果我们选择只与计算上比大脑简单得多的系统交互,然后,对,我们可以期望用我们的大脑系统地理解系统在做什么。

但如果我们真的想充分利用我们的宇宙所能提供的计算能力,那么,我们正在处理的系统在计算能力上必然与我们的大脑相当。这意味着,正如计算不可约性所暗示的那样,我们永远无法系统地“超越”或“理解”那些系统。

但是我们如何使用它们呢?好,就像人们总是使用来自自然世界的系统一样。对,我们不知道他们是如何工作的,也不知道他们可能会做什徳赢彩票游戏么。但是在某种抽象的层次上,我们已经足够了解如何获得我们所关心的目标。徳赢彩票游戏

在数学这样徳赢彩票游戏的领域怎么办?在数学中,我们习惯于建立我们的知识库,这样每一步都是我们可以理解的。但是实验数学以及自动定理证明之类的东西清楚地表明,有些地方没有这个特性。

我们可以称之为“数学”吗?我认为我们应该。但这是一个不同于我们过去千年所用的传统。这是我们仍然可以建立抽象的地方,我们仍然可以构建新的理解水平。徳赢中国

但在下面的某个地方,会有各种各样的计算不可约性,我们将永远无法真正进入人类理解的领域。这就是我的逻辑小公理的证明。It's an early example of what I think will be the dominant experience in mathematics—and a lot else—in the future.

十三评论.显示全部

  1. >作为一个公理系统,它的大小给人一种逻辑的终极信息内容的感觉。

    证明系统采用等式推理,因此,它类似于直觉的一阶逻辑,具有平等的公理或规则。那有多大?强度(尺寸)如何?证明系统的大小与公理系统有关?

    bibibla
  2. Great reading.

    斯塔西斯
  3. 非常鼓舞人心的斯蒂芬!
    别停止发表这篇精彩的文章

    埃托雷
  4. 你好,史蒂芬。唷,这可能需要几个月,如果不是几年,理解。

    玛丽
  5. 我想你在身体的某个地方提过一次,但最后还是值得注意的是,大脑和电脑的接口,“软”外皮质(你基本上描述了它)和其他增强技术将大大扩展“人类”可理解的计算极限。

    布伦南劳森
  6. 很不错的!
    关于不可判定性接近,的确如此;尤其是,俄亥俄州的Harvey Friedman正在进行一个项目(“仿真理论”),在相当具体的数学中显示出不完整性和不确定性。例如有适当关系的q(理性)的乘积。

    伊利亚斯
  7. 希望我的高中或大学能给我上离散数学或基础逻辑课。被舍弗的逻辑公理所束缚,以及“与”与“或”与“与”不可能都是“非”的。

    杰森
  8. 乔治·斯宾塞·布朗1969年出版了《形式法》,在这本书中,他通过一种基于内部/外部对称性的解释,对逻辑进行数学化(使之成为一个简单的计算问题)。1运算符,等价性和2个公理(如下)。他证明了谢弗关于布尔代数的假设,证明了他的初等代数是完备的,证明了初等代数的首字母是独立的。布朗还利用这些形式法则来解决与自我否定逻辑陈述相关的悖论(“这种陈述是错误的”),不再需要白头罗素类型理论。他提供了许多信息丰富的例子,说明如何使用形式法则简单而优雅地计算各种类型逻辑语句系统的解决方案。

    操作人员1:[]\第一个区别的形式;ie,形式,“标记国”;当微积分被解释为逻辑时,等价于布尔值而不是。
    格式:=\\全名:等于
    公理1:[]=[]\\Law of Calling–to Call again is Call
    公理2:[]=\\law of crossing–to cross again is not to have crossed;ie,[[]] = NULL =
    这是算术微积分的缩写的完整列表。

    逻辑非的主要算术解释
    [][][][]\\微积分缩写完整列表[]
    []\\n不是()
    [][]=[]\\not()not()=not())
    []=\\not(not())=空=

    The Primary Algebra Interpreted for Boolean Logics
    A=AA\命题A,投影函数
    [A]=[A][A]=[AA]\\A的否定
    b=bb\\proposition b,投影函数
    [b]=[b][b]=[bb]\\b的否定
    A[A]=B[B]=[]\\t重言式,“所有可能的解释都是正确的”,自我肯定
    [a[a]] = [b[b]] = [[]]\\Contradiction,“所有可能的解释都是错误的”,"self-denying"
    AB\包含分离,或
    共同否认,也没有,皮尔士箭
    A[B]\逆向含义,如果B是A,B推断出
    [A[B]]\\n不含蓄地交谈,,b does not necessitate a
    [a]b\\材料含义,奥林
    [A]B]\\A交叉点。如果且仅当a不表示b时为真
    [答][答]\其他拒绝,与非门,Sheffer脑卒中
    [[a][b]]\\连词,和
    双条件的IFF,A如果且仅如果B
    [[[a] [b] ] [ab ]
    [a]b][a[b]]\\exclusive disjunction,异或

    初等代数:一些对逻辑计算有用的定理
    [[p]p]=[]\\8定理
    定理9
    [P]P]=[]\\j1
    [[pr][qr]] = [[p][q]] r \\J2
    [[a]]=a\\c1
    [AB]B=[A]B\\C2
    []P=[]\\C3
    [a]b]a=a\\c4
    a a=a\\c5
    [a][b]][a]b]=a\\c6
    [[[a]b]c]=[ac][[b]c]\\c7
    [[[a]b r]c r]]=[[[a]b]c]][[[a][r]]\\c8
    [[[b][r]][[a][r]][[x][r]][[y]r]]=[[r]a b][r x y]\交叉转置子
    定理10
    【A】【Br】【CR】…】=【A】【B】【C】…【A】【R】】\定理11
    定理12

    ……等形式法则真的会把你眼睛上的鳞片剥落,为了揭示逻辑的起源,直接进入最基本的感知层(区分)。读起来很有诗意。

    WML
  9. 我想我现在明白了。如果我理解错误,请纠正我?
    使用Wolfram语言的计算方法,你一直在努力发现逻辑的公理集有多简单。谢弗发现了一个3公理集,梅雷迪思发现了一个2公理集,等。
    你的计算结果表明:只需要1个公理:(p.Q)。R)。(p)(p)R)。P)= R。
    …而且你也证明了没有其他的单一公理集(?)

    WML
  10. 好极了!顺便说一句,使用蕴涵->有一个23个字符的单公理,相当于Tarski-Bernays系统(因此是完整的):a1:((p->q->r)->((r->p)->(s->p))(->count a s a single character)[pfenning f.(1988)隐含命题演算中的单公理]

隐藏注释»

?斯vwin中国蒂芬·沃尔夫拉姆,有限责任公司 条款γ RSS