高阶导数与高阶微分的理解

发布时间 2023-04-06 10:58:46作者: 又一岁荣枯

从静态到动态,从有限到无限,正是初等数学与高等数学思维和研究内容的区别。用哲学的观点来说,初等数学相当于形式逻辑范畴,而高等数学则相当于辩证逻辑的范畴。形式逻辑与辩证逻辑思维观之间,存在着一条巨大的鸿沟,想要跨越过去,就必须抛弃已有的习惯思维和狭隘的直觉,数学学习也是如此。

微积分正是反应高等数学思维和研究对象的一个很好的例子,它展示了量变到质变,无穷无限世界里的奇异景象。

上面的话看似普通(有点抽象),可能很多人会觉得像是在说一些废话。但其实并不是这样,因为用初等数学的思维习惯和学习方式不太适合学习高等数学知识。没理解上面表达的意思,是很难理解微分积分等概念的本质。

要了解微分到底是什么意思,先看从初等数学观点来看问题。

对于一元函数 y=y(x),考虑自变量的一个有限的增量 \Delta x ,即从 x 增加到 x+\Delta x 后,函数从 y(x) 增加到 y(x)+\Delta y(x)

函数的增加量怎么算呢?如果了解泰勒级数,可以从泰勒展开逐步逼近,但我们暂时只有初等数学知识,只能从一种非常直观的几何角度来看:

将一元函数视为一条函数曲线,不难发现(这里不配图,自己大脑想象),增加的高度 \Delta y(x) 、增加的长度 \Delta x、两端点对应于曲线上的点的连线(截线或割线)构成一个三角形。根据三角函数关系可知,必然有

\Delta y(x)=s(x,\Delta x)\Delta x

这个 s(x,\Delta x) 就是割线的斜率,它的大小与 x,\Delta x 取值有关。

如果将 \Delta x 不断减小,曲线上两截点就会越来越靠近,以至于最终合为一点。此时对应的割线称之为“切线”,对应的斜率称为曲线在重合点 x 处的斜率 s_0(x) \Delta y(x)=s(x,\Delta x)\Delta x=s_0(x)\Delta x+o(\Delta x)\quad(\Delta x\to 0)\tag{a}

上面表达的是当 \Delta x 趋近于零时, \Delta y 可用一个函数 s_0(x) 与 \Delta x 的乘积再加上一个总是比\Delta x 小的量(高阶无穷小量)来逼近,因此可以为商的形式

\lim_{\Delta x\to 0}\frac{\Delta y(x)}{\Delta x}=s_0(x)\tag{b}

通常用 符号y' 表示切线斜率 s_0(x) ,而将上面这个 \Delta x\to 0 的极限操作过程称之为微分操作,用符号d表示(取自微分的英文单词differentiate首字母);后面的变量表示对这个变量进行微分操作,故上面的极限式可写为微分形式

\mathrm dy(x)=y'(x)\mathrm dx\tag{1}

即函数的微分等于其切线斜率乘以自变量的微分。

注意,d只是一个符号,它不是函数。从现代数学观点来看,它是一个算子,表示对某个数学对象(可以是函数、算子、常数、变量等)进行微分操作,算子后所跟的表达式为所作用的对象。算子作用得到的结果不是一个具体的变量(函数)或常量,而是一个无穷小量。

为了区别变量(斜体字母)和算子,通常使用正体符号 \mathrm d 表示它是一个微分算子,而不是变量(否则可以约去)。因此,要将 \mathrm d \square 视为一个整体结果(即微分算子作用于 \square 后的结果)。比如, \mathrm d\mathrm d 为微分算子的二重作用,为方便起见,可简记为 \mathrm d^2 ,而 (\mathrm dx)^2 简记为 \mathrm dx^2 ——注意它与\mathrm d(x^2)的区别。

那么二阶微分怎么来的?一阶微分是通过几何意义来定义的,所以二阶微分仍应从这个角度出发:

\mathrm dy'(x)=y''(x)\mathrm dx\tag{2}

也就是说,将导函数(斜率函数)看成一个新的曲线,其斜率与自变量微分的乘积就等于导函数的微分。

为书写方便起见,下面用y代替y(x),那么有 \mathrm d(\mathrm dy/\mathrm dx)=y''\mathrm dx

接下来就要使用微分运算法则了:

\frac{\mathrm d\mathrm dy\cdot\mathrm dx-\mathrm dy \cdot\mathrm d\mathrm dx}{(\mathrm dx)^2}=y''\mathrm dx

通过简单的代数运算,就有

\mathrm d^2y=\frac{y'' \mathrm dx^3+\mathrm dy \cdot\mathrm d^2x}{\mathrm dx}=y''\mathrm dx^2+y'\mathrm d^2x\tag{3}

这个结果说明:一个函数的二阶微分可以表达成两部分的和,其中一部分是二次斜率(二阶导数)与自变量微分的平方之积,另一部分则是斜率与自变量二次微分之乘积。

将(3)式两边同时除以 \mathrm d x^2 ,由于 \mathrm d^2 x 是 \mathrm dx^2 的高阶无穷小,因此一阶导数项为零,即

y''=\frac{\mathrm d^2y}{\mathrm dx^2}

类似地,更高阶微分可类似推导。

注意:这个方法在计算反函数高阶导函数公式时,同样适用。

————————————————————————————

补充:现在说有限增量和微分的关系:从几何上来看,增量 \Delta y 可视为许许多个更加细小的函数增量求和而成,而这些细小的函数增量来自于将 \Delta x 无限细分(微分操作)后相应各自的函数增量(函数的微分)。利用上面切线斜率的定义,将这些细小函数增量累计求和(称之为积分操作): \Delta y=\mathrm S_{\mathrm{um}}\mathrm dy=\int_x^{x+\Delta x}\mathrm dy=\int_x^{x+\Delta x}y'\mathrm dx

上面的Sum表示求和,莱布尼兹为了方便,用第一个字母S拉长表示积分符号(沿用至今)。这个符号就是对无穷小的微分进行求和而已。

等式最左边表示求和起止点对应函数值之差,而最右边表示导函数(切线斜率)在这个范围内的积分操作——这就是著名的牛顿-莱布尼兹公式,揭示了微分和积分互为逆运算。

现在应该明白了为何求积分时后面为何要加一个 \mathrm d x 之类的东西了吧?这不是数学书写习惯,也不是故意要这么写,而是有其数学意义的。

积分的本质就是对无穷个无穷小量进行求和所得,因此从这个意义上来讲,dy,dx本身不是一个有限常量,也不是一个变量,而是一个动态变化的无穷小量,而微分关系则反映了这些不同微分量之间的关系。

———————————————————————————

补充:针对评论中的疑问,现来说明(3)式中最后一项为何不能省略。

这一项是非常重要的一项,它属于微分结果的组成部分,无论它多么小也不可忽略(理解一下质变到量变,不仅是在积分上,在导数定义上也是如此)。因此,要注意微分和导函数(微商)不是同一个东西。

比如复合函数 y=\sin u,u=x^2 ,利用公式(3)求二阶微分有 \mathrm d^2y=y''\mathrm du^2+y'\mathrm d^2u

我们用它可以很方便求对 x 的二阶导数:将 y''=\mathrm d^2y /\mathrm du^2 以及 y'=\mathrm dy/\mathrm du 代入后得

\mathrm d^2y=-\sin u\mathrm du^2+\cos u\mathrm d^2u

将上式两边同时除以 \mathrm dx^2 ,并考虑到 \mathrm du^2/\mathrm dx2=(u')2=4x^2,\mathrm d^2u/\mathrm dx^2=u''=2 ,有

\frac{\mathrm d2y}{dx2}=-4x^2\sin x^2+2\cos x^2

这个结果与直接对函数 y=\sin x^2 两次求导的结果是一样的。