Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

思、肖清参与

看得懂的数学之美:从青年欧拉对巴塞尔问题的解法说起

什么是数学之美?就是思考的时候忘记时间的流逝,解答或证明后无与伦比的快乐。


欧拉,历史上最重要的数学家之一,也是最高产的数学家,平均每年能写八百多页论文。我们经常能见到以他名字命名的公式与定理,可能最广为人知的便是「世界上最美的公式」欧拉公式。

先不说它的具体意义,能将自然数、虚数、π、0 和 1 这几个最基本的元素组合在一起,就是令人惊叹的美。欧拉公式将指数函数的定义域扩大到了复数域,同时建立三角函数和指数函数的关系,被誉为「数学中的天桥」。



这样的数学方程是极具美感的,而要构建这样的方程,整个思考与推导过程同样是非常优美的。数学最吸引人的地方,就在于这一步步推导的过程,一种拨开云雾见月明的感觉。

在本文中,我们希望通过一步步重现欧拉解巴塞尔问题的过程,体会到这种数学之美。

巴塞尔问题是一个著名的数论问题,这个问题首先由皮耶特罗·门戈利在 1644 年提出,由欧拉在 1735 年解决。由于这个问题难倒了以前许多数学家,欧拉一解出这个问题马上就出名了,当时他二十八岁。这个问题是以瑞士的第三大城市巴塞尔命名的,为了纪念它是欧拉和伯努利家族的家乡。

文章将解释欧拉是如何解决著名的巴塞尔问题的,看看如何用简单的 sin(x) 函数和多项式,再借助泰勒级数的强大能力,解决这个问题。



巴塞尔问题

巴塞尔问题起先在 1650 年就提出来了,它的目标在于求解某一离散无穷数列的和,具体来说,巴塞尔问题可以描述为如下:

如果读者们还记得高数,记得无穷级数,你就会发现巴塞尔问题其实就是一个幂级数求和问题。当时很多学者都在想方法去计算这个问题,但欧拉在 28 岁时就证明了它,使得数学界非常惊叹。欧拉最初的证明方法并不一定是非常严格的,但它是非常优美的,简洁的过程与新奇的想法,使得我们能体会到「数学之美」。

欧拉最初的想法来自 sinc(πx) 函数,他将该函数定义为如下:
函数的图像如下所示,当 x 趋向于 0 时,因为 sin(x) 与 x 的速度等同,它们相除最终会收敛到 1。之所以要构造这个函数,答案就藏在它的零点,即当 sinc(πx) = 0 时 x 的所有取值。


为了理解这一点,考虑如下四次多项式的零点,很明显当 x 分别等于 𝛂 和 𝛃等常量的时候存在零点。

如果将上述展开为一般的多次方程,我们可以得到如下表达式。这里需要注意的是平方项前面的系数,它看起来有构造成巴塞尔问题的可能性,毕竟分母都是两个数相乘。
欧拉的策略就和它一样,只要构造成连乘的状态,我们就可以了解到方程的零点。如果某一个函数所有零点等同于另一个函数的所有零点,那么至少在零点附近,它们是近似的。这样就构建了个等式,只要一边有巴塞尔问题,它就是可解的。

虽然想法很好,但如果要类比巴塞尔问题,真实的展开式需要是一种超越函数(transcendental function),即变量之间的关系不能通过有限次的基本数学运算表示,例如 sin(x) 等三角函数就是超越函数。


超越函数

这种函数并不是指方程 4 那种有限的多项式函数,指数函数、三角函数及对数函数才是最出名的超越函数。

上图所示分别为指数函数,对数函数及三角函数的图像。之前已经介绍过 sinc(πx) 函数了,可以看出来,该函数的零点就是所有正负整数。

欧拉借助下面我们非常熟悉的数学转换来展开 sinc(x) 在零点的情况。
因为 sinc(πx)/πx 的零点为正负 n,其中 n 是自然数,那么根据 上文方程 3 的思想,该函数可以写为如下的连乘形式。这种形式展示了当 sinc(πx)/πx=0 时,它的所有根。
下一步只需要展开到平方项就行了,至于为什么,等一下就知道了。这个也好解决,分别用 1 和 -x^2 去乘以后面的项就行了,1 每次只能乘以一个二次项和所有零次项,才能保证它是最终二次项的系数。
现在等式右边已经完全展开了,我们可以看到平方项系数存在 1/n^2(n 为 1、2、3...),这就是最终需要计算的巴塞尔问题。但左边还没有展开,我们现在还算不出该级数的最终结果。

如果我们把等式左边的 x 移到右边,即产生了一个 x 三次方项,现在左边只剩下 sinc(πx)。现在学过泰勒展开式的你知道要怎么解了吗?只需要把 sinc(πx) 展开到 x 的立方项,那么立方项的系数肯定是相等的,因此也就能解出巴塞尔问题了。


泰勒级数

泰勒级数使用无限项连加的形式来表示某一函数,每一项都是由该函数在某一点的 n 阶导数计算得来。我们可以理解为,泰勒级数采用无穷的子项去逼近某一个连续可导函数,每一个高阶导数,都是对该值的一点点逼近,最终收敛到该函数。

图 6. 当泰勒级数的数目不断增加,它最终将收敛于其表示的那个函数。图中黑色曲线代表 sin(x) 函数。其他曲线为其对应不同阶次的泰勒展开式,也就是最高次幂分别为 1,3,5,7,9,11 和 13 的多项式。

我们还记得,需要找的是逼近 sinc(πx) 立方项的系数,图 6 中的 7 个泰勒展开式具有如下形式:


现在方程 7 整个左边可以根据泰勒展开式表示为如下,我们需要抽取出 x 平方的系数。


我们可将式 8 看做具有无穷次幂的「伪多项式」,这样的伪多项式有无穷多个根,其对应的根由式 5 给出。但我们现在不想关心它的性质,我们只想用系数解出巴塞尔问题。

联系等式左右,解决问题

通过联立式 7 和式 9 sinc(x) 展开后的二次项系数,即可得到我们最初想要解决的巴塞尔问题:


不仅如此,欧拉的推导过程产生了著名的 Wallis 乘积公式。仅需将 x = 1/2 代入式 6 并求其倒数即可得到:


现在,我们跟着欧拉解决了巴塞尔问题,整个思考过程不涉及复杂的数学技术与概念。只需要一步步跟着它的思路走,就能通过一系列巧妙的变换,解决数学难题。这样的思考过程、逻辑推理过程,正体现着数学之美。

参考链接:
https://towardsdatascience.com/on-the-beauty-of-math-f2453be9db84
https://www.bilibili.com/video/av20400157/
入门欧拉巴塞尔问题Wallis 乘积公式
1
相关数据
收敛技术

在数学,计算机科学和逻辑学中,收敛指的是不同的变换序列在有限的时间内达到一个结论(变换终止),并且得出的结论是独立于达到它的路径(他们是融合的)。 通俗来说,收敛通常是指在训练期间达到的一种状态,即经过一定次数的迭代之后,训练损失和验证损失在每次迭代中的变化都非常小或根本没有变化。也就是说,如果采用当前数据进行额外的训练将无法改进模型,模型即达到收敛状态。在深度学习中,损失值有时会在最终下降之前的多次迭代中保持不变或几乎保持不变,暂时形成收敛的假象。

逻辑推理技术

逻辑推理中有三种方式:演绎推理、归纳推理和溯因推理。它包括给定前提、结论和规则

导数技术

导数(Derivative)是微积分中的重要基础概念。当函数y=f(x)的自变量x在一点x_0上产生一个增量Δx时,函数输出值的增量Δy与自变量增量Δx的比值在Δx趋于0时的极限a如果存在,a即为在x0处的导数,记作f'(x_0) 或 df(x_0)/dx。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

推荐文章
暂无评论
暂无评论~