数学里面有许多对象和结构,我们想对它们做些什么。 例如,给出了一个数,我们会按照上下文去把它加倍、求平方或者求倒数;给定了一个适当的函数,我们可能想去微分它;给定了一个几何图形,我们可能会想去作变换等等。
如果我们定义了一个数学程序,那么去发明执行这个程序的技巧就是一个很显然的数学计划。这就会引出关于这个程序的所谓的直接问题。然而,还有一类更深刻的所谓反问题,其形式如下。假设给出了程序,和执行程序所得到的答案,那么能不能搞清楚这个程序是作用在什么数学对象上的?举一个例子会非常清楚,假如我告诉你,有一个数,把它平方,结果是9。你能不能告诉我这个数是什么?很简单,答案是3或者-3。
如果想更加形式化地讨论这个问题,就会说,刚才是在研究方程x^2=9,而且发现它有两个解。这样的例子提出了三个一般问题:
一个方程是否有解?
如果有,是否恰好有一个解?
这些解在什么样的集合之内?
前两个问题称为解的存在与唯一性问题。第三个问题在方程 x^2=9的情况下没有太大的意义,但是在更复杂的情况下,例如对于偏微分方程,就可能是很重要的问题。
用更抽象的语言来说,设f是一个函数,面前就是这样一个命题,其形式是f(x)=y,直接问题就是给定了x求y,反问题则是给定了y求x,这个反问题就叫做解方程式f(x)=y。关于求解这种形式的方程式的问题与函数f的可逆性问题密切相关。因为x和y可能是比数一般得多的对象,解方程式的概念本身也就是非常一般的,因此也就是数学的中心问题之一。
线性方程小学生们最初遇见的方程典型地就是像2x+3=17这样的方程。要解这样简单的方程,我们把x看成未知数,而未知数也得服从算术通常的法则。利用这些法则,就可以把这个方程化为简单得多的方程∶从方程两边减去3,就得到2x=14,再用2除这个新方程的两边,就得到x=7。我们实际上证明了∶如果有某个数 x,使得 2x+3=17,那么这个数一定就是7。我们还没有证明的是∶确实有这样的数x。 所以,严格地说,还应该有下一步,即验证2×7+3=17。这里,它显然是对的,但是对更加复杂的方程,相应的论断就不一定总是对的,所以最后这一步还是重要的。
方程2x+3=17称为线性方程。这是因为作用在x上的函数(乘以2,然后再加3)是一个线性函数。正如刚才看到的,只含一个未知数的线性方程是容易解的,但是如果要解多于一个未知数的方程,情况就要复杂些了。考虑含有两个未知数的方程的典型例子,即方程3x+2y=14。这个方程有许多解,选定一个y 以后,就可以令
于是就有了一对(x,g)满足这个方程。要想使问题更难一点,可以再加一个方程,例如5x+3y=22,然后试着同时解出这两个方程。 这时的结果又是只有一个(一组)解x=2以及y=4。一般情况下,含两个未知数的两个线性方程恰好有一组解。如果从几何来看这个情况,这是很容易理解的。形如ax+by=c的方程是xy平面上一条直线的方程。两条直线正常地交于一个点,例外情况是这两条直线相同,这时它们交于无穷多个点,或者它们平行,这时它们根本不相交。
如果有好几个含有几个未知数的方程,把它们看成含有一个未知的东西的一个方程,在观念上会简单一些。这听起来完全不可能,但是,如果允许这个未知的东西是一种更复杂的对象,却是完全可能的。例如3x+2y=14和5x+3y=22这两个方程可以写成单个含有矩阵和向量的方程
如果用A表示上面的矩阵,x表示未知的向量,b表示已知的向量,则这个方程变为Ax=b,它看起来要简单多了,尽管在事实上只是把复杂性隐藏在符号里面了。
然而这个过程可不只是“把垃圾扫到地毯下面藏起来”,而是还有更多的东西。一方面,简单的符号固然掩盖了这个问题的许多特定的细节,另一方面却也把一些本来看不出来的东西揭示出来了:有一个从R^2到R^2的线性映射,想要知道的是哪一个向量 x被映为向量 b(如果有这样的向量的话)。如果遇到的是一个特定的联立方程组的话,这并有太的区别,我们需要做的计算还是一样的。但是如果希望作一般的推理,那么含有单个未知向量的矩阵方程就比含有几个未知数的联立的方程组要容易考虑得多。这个现象会出现在整个数学中,而且是研究高维空间的主要方法。
多项式方程我们刚才讨论了线性方程从一个未知数到多个未知数的推广。推广它们的另一个方向是把线性方程看成是1次多项式,而考虑更高次数的函数。例如在中学里,我们就学习过怎样解诸如
这样的二次方程式。更一般的多项式方程形如
解这样的方程,就是求x的值满足这个方程。 这似乎是一件很显然的事,但是在遇到简单如
这样的方程的时候,就并不如此显然。这个方程的解是
那么,什么是根号2呢?它的定义就是平方以后等于2的正数。但是说x等于正的或负的且平方以后为2的数,似乎还没有把这个方程“解”出来。即使说x=1.4142135…也不能完全令人满意,因为这只是把一个没有尽头的式子写出了开头一小段,而且也看不出来这个式子里有什么可以辨别出来的模式。
从这个例子可以得到两个简介:
其一是,对于一个方程,要紧的时常是解的存在与性质,而不是是否能找到解的公式。
虽然当我们说
并没有让我们学到什么,但是这个论断中确实包含了一个事实∶2有平方根。这一点通常是作为所谓中间值定理的推论而提出的。这个定理指出,若f是一个连续的实值函数,而f(a)和f(b)各在零的一侧,则在 a,b之间的某处,一定有一个实数c使得f(c)=0。这个结果可以用于函数f(x)=x^2-2,因为f(1)=-1,而f(2)=2。所以在1,2之间一定有一个x 使得x^2-2=0。对于许多目的,知道这个x的存在,再加上知道定义这个x的性质使它为正且平方以后为2,这就足够了。
用类似的论证,就知道所有的正实数都有正平方根。但是当我们试图解更加复杂的二次方程时,情况就不一样了。这时有两条途径可供选择。例如考虑方程
我们会注意到,当x=4时,它的值是-1,而当x=5时,其值是2,由此从中间值定理就知道,这个方程在4与5之间有一个解。但是如果用配方法,
就会得到两个解,这比利用中间值定理得到的信息要更多。我们已经证明了根号2的存在,而且知道其值在1和2之间。现在不仅是知道了方程x^2-6x+7=0有一个解在4和5之间,而且还知道了这个解与方程x^2=2的解有密切的关系,甚至可以说,这个解正是从方程x^2=2的解构造出来的。
这就证明了求解方程还有第二个重要的方面,那就是在许多情况下,解的显式的可解性是一个相对的概念。只要给了方程x^2=2的一个解,在求解比较复杂的方程x^2-6x+7=0时,就不再需要从中间值定理得到什么新的输入,需要的就仅仅是一点代数而已。
但是这个表达式里的根号2 就不是由一个显式公式来定义,而是作为一个实数而定义的。这个实数有一些性质,而我们可以证明其存在。
解更高次的多项式方程比解二次方程要难得多,而且由此产生了许多吸引人的问题。特别是,求解三次或四次方程有复杂的公式,但是几百年来求解五次以及更高次的方程就一直是一个未解决的著名问题,直到19世纪,阿贝尔和伽罗瓦才证明了显式解的公式是找不到的。
多变元的多项式方程设有这样的方程
我们可以看出来它有许多解∶如果固定x和y,就得到一个z的三次多项式方程,所有的三次多项式方程都有(至少一个)实解,所以对于每一个固定的x和y,都有某个 z 使得三元组(x,y,z)成为这个方程的解。
因为三次方程解的公式十分复杂,准确地描述所有这些三元组(x,y,z)的集合就没有什么意义。但是,若把解的这个集合看成一个几何对象,即空间里的一个2维曲面,并且考虑一些关于它的定性的问题,就可以从中学到不少东西。例如我们可能希望了解其大体的性质如何,用拓扑学的语言,可以把这些问题说清楚。
当然还可以进一步推广来考虑几个多项式方程的同时求解。理解这些方程组的解集合属于代数几何的领域。
丢番图方程一个特定的方程是否有解,需视允许在何处求解而异。如果只允许x为实数,则方程x^x+3=0就没有解,但是在复数里,它就有两个解。 方程x^2+y^2=11有无穷多个解,但是如果求x和y都是整数,这个方程就没有解。
上面的例子是典型的丢番图方程,凡见到这个名词就表示要求它的整数解。最著名的丢番图方程就是费马方程
感谢怀尔斯的工作,现在已经知道当n大于2时,它没有正整数解,与此形成对照,方程x^2+y^2=z^2却有无穷多个整数解。现代的代数数理论的很大一部分都是在直接或者间接地讨论丢番图方程。正如对于实数或复数的方程一样,讨论丢番图方程解的集合的结构是富有成果的,这类研究属于算术几何的领域。
丢番图方程的一个值得注意的特点是它们极为困难。所以自然地会怀疑,对于它们是否可能有一个系统的处理方法,这是希尔伯特在1900年提出的著名问题清单中的第10个问题。但是一直到1970年Yuri Matiyasevich才指出,这个问题的回答是否定的。
这个问题的解决,重要的一步是在1936年由丘奇和图灵做出的。只是通过(以两种不同的方法)把算法概念形式化,从而把“系统地处理”这个概念弄清楚以后,才走出了这一步。在计算机时代以前,这是不容易的,但是我们现在却可以把希尔伯特第10问题的解决重述如下∶
想找一个计算机程序使得在输入任意的丢番图方程后,如果这个方程有解,它就一定会输出“YES”,无解的时候就一定会输出“NO”,而且从不出错,这是做不到的。
关于丢番图方程,这告诉了我们什么呢?我们再也不能梦想会有一个囊括所有这种方程的最终的理论,相反,我们被迫集中注意于这种方程的特殊的类别,并且对它们发展不同的解法。如果不是因为丢番图方程与数学的其他部分的很一般的方程有值得注意的联系,这似乎会使得在解决了最初几个方程以后,丢番图方程就没有趣味了。
例如方程
看起来很特殊,事实上,它所定义的椭圆曲线却是现代数论(包括费马大定理的证明)的中心问题。当然费马大定理本身也是一个丢番图方程,但它的研究又导致了数论的其他部分的重大发展。应该得出的正确的结论可能是∶解一个特殊的丢番图方程,如果其结果不只是在已经解决的方程清单上再添加一个而已,那么,它是吸引人的,是值得去研究的。
微分方程迄今为止,我们考虑的方程都是以数或n维空间的一点为未知的东西的。要生成这样的方程,我们作算术的基本运算的不同组合,然后把它们施加到未知的东西上去。
下面给出两个著名的微分方程以便与过去讨论过的方程作比较∶
第一个是“常”微分方程,是简谐运动方程,它有通解
第二个是“偏”微分方程,是热方程。
有许多理由说明求解微分方程在精巧性上是一个飞跃。
一个理由在于,现在未知的东西是函数,它比数或者 n 维空间的点复杂得多。
第二个理由是,施加于函数上的运算微分和积分,它们远不如加法和乘法那么“基本”。第
三个理由是,微分方程,哪怕是很自然很重要的方程,可以用“封闭形式”解出的,就是用一个公式来表示未知函数f的,只是例外而非常规。
现在回到第一个方程,
这意味着微分方程可以看成是一个矩阵方程推广到无穷多维的情况。热方程也有同样的性质∶如果定义Ψ(T)为
则Ψ是另一个线性映射。这种微分方程称为线性的,它们与线性代数明显的联系使得它们容易求解得多,这方面一个有用的工具是傅里叶变换。
那些更加典型的方程,即不能用封闭形式解出的方程又如何?那时,焦点就又一次转移到是否有解存在?如果有,它们又有哪些性质?和多项式方程一样,这要依赖于把什么当成是可以允许的解。有时,我们就像又处在研究方程x^2=2时的境地∶证明解的存在并不难,只需要给它取一个名字就行了。方程
就是一个简单的例子。在某种意义下,它是不能解出来的,可以证明,找不到一个由多项式、指数函数、三角函数等的"基本的"函数构建出来而微分以后又会得到e^(-x²)的函数。然而在另一种意义下,这个方程又很容易求解,只需要把函数e^(-x²)积分一下就行了,所得到的函数就是正态分布函数。这个函数在概率论里面有基本的重要性,所以就给了它一个名字(记号):
在绝大多数情况下,写出解的公式是没有希望的事情。一个著名的例子是三体问题∶给出空间里的三个运动的物体(质点),并设它们以引力互相吸引,问它们会怎样继续运动?用牛顿定律可以写出描述这一情况的微分方程。对于两个运动着的物体,牛顿解出了相应的方程,并由此解释了为什么行星绕太阳沿椭圆轨道运动,但是对于三个或更多的物体,这些微分方程被证明是非常难解的。现在已经知道了,这种难解的情况有很深刻的理由∶这时,这些微分方程会导致混沌性态。然而,这就打开了研究混沌和稳定性这些非常有趣的问题的大道。
有时候,有方法证明解是存在的,哪怕这些解不能容易地确定下来。这时,可以不要求得到精确的公式,而只希望得到一般的描述。例如,如果这个方程有着时间依赖性(例如热方程和波方程就都有),人们就会问,解是否随时间而衰减、爆破,或者大体上不变?这些更加定性的问题称为渐近性态问题,有一些技巧来回答这一类的某些问题,尽管没有显式公式把解给出来。
和丢番图方程的情况一样,偏微分方程包括非线性偏微分方程中有一些特殊而又重要的类,可以把解准确地写出来。这就给出了一种非常不同的研究风格∶人们又一次关注于解的性质,但是这一次是本性上更加代数化的性质,就是说,解的公式将要起更重要的作用。
好文章[点赞][点赞][点赞]