平面点集

在平面上确立了直角坐标系之后,所有有序实数对 (x,y)(x,y) 与平面上所有点之间建立起了一一对应关系,坐标平面上满足某种条件 PP 的点的集合,称为平面点集(planar point set),记作

E={(x,y)(x,y) 满足条件 P}E=\{(x,y)|(x,y)\ \text{满足条件}\ P\}

将平面上两点 P1(x1,y1)P_1(x_1,y_1)P2(x2,y2)P_2(x_2,y_2) 之间的距离记为 ρ(P1,P2)\rho(P_1,P_2)。在Euclid空间中,两点间距离可以表示为:

ρ(P1,P2)=(x1x2)2+(y1y2)2\rho(P_1,P_2)=\sqrt{(x_1-x_2)^2+(y_1-y_2)^2}

常见平面点集:

(1)全平面:R2={(x,y)<x<+,<y<+}\mathbb R^2=\{(x,y)|-\infty<x<+\infty,-\infty<y<+\infty\}

(2)圆:C={(x,y)x2+y2<r2}C=\{(x,y)|x^2+y^2<r^2\}

(3)矩形:S={(x,y)axb,cyd}S=\{(x,y)|a\leq x\leq b,c\leq y\leq d\}

也常记作:S=[a,b]×[c,d]S=[a,b]\times[c,d]

(4)点 A(x0,y0)A(x_0,y_0)δ\delta 邻域,即 U(A,δ)U(A,\delta)

  • 圆形邻域:{(x,y)(xx0)2+(yy0)2<δ2}\{(x,y)|(x-x_0)^2+(y-y_0)^2<\delta^2\}
  • 方形邻域:{(x,y)xx0<δ,yy0<δ}\{(x,y)||x-x_0|<\delta,|y-y_0|<\delta\}

(5)点 A(x0,y0)A(x_0,y_0)δ\delta 去心邻域,即 U˚(a,δ)\mathring{U}(a,\delta)

  • 圆形邻域:{(x,y)0<(xx0)2+(yy0)2<δ2}\{(x,y)|0<(x-x_0)^2+(y-y_0)^2<\delta^2\}
  • 方形邻域:{(x,y)xx0<δ,yy0<δ,(x,y)(x0,y0)}\{(x,y)||x-x_0|<\delta,|y-y_0|<\delta,(x,y)\neq(x_0,y_0)\}

点与点集的关系

任意一点 AR2A\in\mathbb R^2 与任意一个点集 ER2E\subset\mathbb R^2 之间必有以下三种关系之一:

  1. 内点:δ>0\exists\delta>0,使得 U(A,δ)EU(A,\delta)\subseteq E,则称点 AAEE内点(interior point),由 EE全体内点所构成的集合称为 EE内部,记作 intE\mathrm{int}E

  2. 外点:δ>0\exists\delta>0,使得 U(A,δ)E=U(A,\delta)\cap E=\emptyset,则称点 AAEE外点(exterior point),由 EE全体外点所构成的集合称为 EE外部

  3. 界点:δ\forall\delta,恒有 U(A,δ)EU(A,\delta)\cap E\neq\emptyset 并且 U(A,δ)EU(A,\delta)\cap\overline E\neq\emptyset,则称点 AAEE界点(boundary point),由 EE全体界点所构成的集合称为 EE边界,记作 E\partial E

EE 的内点必定属于 EEEE 的外点必定不属于 EEEE 的界点可能属于 EE 也可能不属于 EE

只有当 EE\partial E\subset E 时,E\overline E 才可以被称为是 EE 的外部。

按照点 AA 的近旁是否密集着 EE 中的无穷多个点,点与点集还可以构成另一类关系:

  1. 聚点: 若在点 AA 的任何去心邻域 U˚(A)\mathring{U}(A) 内都含有 EE 中的点,则称点 AAEE聚点(accumulation point)

聚点本身可以不属于 EE

  1. 孤立点:δ>0\exists\delta>0,使得 U˚(A,δ)E=\mathring U(A,\delta)\cap E=\emptyset,则称点 AAEE孤立(isolated point)

AEA\in E,并且 AA 不是 EE 的聚点,则 AAEE 的孤立点。

两种点与点集关系的联系:

  • 孤立点必为界点。
  • 内点和非孤立点的界点必为聚点。
  • 既非聚点,又非孤立点,则必为外点。

重要平面点集定义

1. 开集:
EE 所属的每一点都是 EE 的内点(即 E=intEE=\mathrm{int}E),则称 EE开集(open set)

2. 闭集:
EE 的所有聚点都属于 EE(即 E=EE=\overline E)或 EE 没有聚点,则称 EE闭集(closed set)

在平面点集中,只有 R2\mathbb R^2\emptyset 是既开又闭的。

3. 开域:
非空连通开集即为开域(open region)

所谓连通性(connectivity),即 EE 中任意两点之间都可以用一条完全含于 EE 的有限折线相连接。

4. 闭域:
开域连同其边界所成的集合称为闭域(closed region)。开域和闭域统称为区域

闭域必为闭集,而闭集不一定为闭域。

5. 凸区域:
若一个区域中任意两点 P1(x1,y1),P2(x2,y2)P_1(x_1,y_1),P_2(x_2,y_2),都满足 P(x1+λ(x2x1),y1+λ(y2y1))P(x_1+\lambda(x_2-x_1),y_1+\lambda(y_2-y_1))λ\lambda 为任意常数)也在该区域中,则该区域为凸区域

6. 有界/无界点集:
对于平面点集 EE,若 r>0\exists r>0,使得

EU(O,r)E\subset U(O,r)

其中 OO 是一固定点,称 EE有界点集(bounded point set)rr 为点集的半径

点集的有界性可以用点集的直径来反映,所谓点集的直径,即

d(E)=supP1,P2Eρ(P1,P2)d(E)=\sup_{P_1,P_2\in E}\rho(P_1,P_2)

其中 ρ(P1,P2)\rho(P_1,P_2)P1P_1P2P_2 之间的距离。

d(E)d(E) 为有限值时,EE 为有界点集,否则为无界点集。

全平面上的完备性定理

点列的收敛性:

{Pn}R2\{P_n\}\subset\mathbb R^2 为一列点,P0P_0 为一固定点,若 ε>0\forall\varepsilon>0NN+\exists N\in \mathbb N_+,使得当 n>Nn>N 时,PnU(P0,ε)P_n\in U(P_0,\varepsilon),则称点列 {Pn}\{P_n\} 收敛于点 P0P_0,记作:

PnP0 (n)limnPn=P0P_n\to P_0\ (n\to\infty)\qquad \lim_{n\to\infty}P_n=P_0

PnP_nP0P_0 分别为 (xn,yn)(x_n,y_n)(x0,y0)(x_0,y_0) 时,显然有

limnxn=x0 且 limnyn=y0\lim_{n\to\infty}x_n=x_0\ \text{且}\ \lim_{n\to\infty}y_n=y_0

若记 ρn=ρ(Pn,P0)\rho_n=\rho(P_n,P_0),则有

limnρn=0\lim_{n\to\infty}\rho_n=0

柯西收敛准则:

{Pn}R2\{P_n\}\subset\mathbb R^2 收敛的充要条件是:ε>0\forall\varepsilon>0NN+\exists N\in \mathbb N_+,使得当 n>Nn>N 时,都满足

ρ(Pn,Pn+p)<ε,pN+\rho(P_n,P_{n+p})<\varepsilon,\quad\forall p\in \mathbb N_+

闭域套定理:

{Dn}\{D_n\}R2R^2 中的一列闭域,它满足:

  1. Dn+1Dn, n=1,2,D_{n+1}\subset D_n,\ n=1,2,\cdots
  2. dn=d(Dn), limndn=0d_n=d(D_n),\ \lim\limits_{n\to\infty}d_n=0

则存在唯一的点:

P0Dn, n=1,2,P_0\in D_n,\ n=1,2,\cdots

推论: 对上述闭域套(或闭集套){Dn}\{D_n\}ε>0\forall\varepsilon>0NN+\exists N\in \mathbb N_+,当 n>Nn>N 时,DnU(P0,ε)D_n\subset U(P_0,\varepsilon).

聚点定理:

ER2E\subset\mathbb R^2 为有界无限点集,则 EER2\mathbb R^2 中至少有一个聚点。

有限覆盖定理:

ER2E\subset\mathbb R^2 为一有界闭域(或有界闭集),{Δα}\{\Delta_\alpha\} 为一集族开域(或开集),它覆盖了 DD,则在 {Δα}\{\Delta_\alpha\} 中必存在有限个开域 Δ1,Δ2,,Δn\Delta_1,\Delta_2,\cdots,\Delta_n,它们同样覆盖了 DD,即

Di=1nΔiD\subset\bigcup_{i=1}^n\Delta_i

多元函数

多元函数的定义:

DDRn\mathbb R^n 的非空子集,将从 DD 到实数集 R\mathbb R 的映射 fRf\to\mathbb R 称为定义在 DD 上的 nn 元函数,记作:

f:x=(x1,x2,,xn),u=f(x),xDf:\bm x=(x_1,x_2,\cdots,x_n),\quad u=f(\bm x),\quad\bm x\in D

u=f(x)=f(x1,x2,,xn),xDu=f(\bm x)=f(x_1,x_2,\cdots,x_n),\quad\bm x\in D

其中 x1,x2,,xnx_1,x_2,\cdots,x_n 称为自变量uu 称为因变量DD 称为函数 ff定义域,集合

f(D)={f(x)xD}f(D)=\{f(\bm x)|\bm x\in D\}

称为函数 ff值域。若值域是有界数集,则称函数 ffDD 上为有界函数,否则为无界函数。

我们在这里研究的一般是二元函数,可以记作:

z=f(x,y),(x,y)Dz=f(x,y),\quad (x,y)\in D

或点函数形式:

z=f(P),PDz=f(P),\quad P\in D

二元函数的图像:

对于任意一个点 P(x,y)DP(x,y)\in D,有一个确定的函数值 z=f(x,y)z=f(x,y),以这个 zz 为竖坐标,这样就可以作出空间 OxyzOxyz 中一点 M(x,y,f(x,y))M(x,y,f(x,y)).

称三维空间中的点集:

W={(x,y,z)z=f(x,y),(x,y)D}W=\{(x,y,z)|z=f(x,y),\quad(x,y)\in D\}

为二元函数 z=f(x,y), (x,y)Dz=f(x,y),\ (x,y)\in D 的图像。

二重极限

二重极限的定义:

ff 是定义在 DR2D\subset\mathbb R^2 上的二元函数,P0P_0DD 中的一个聚点,AA 为常数,若 ε>0\forall\varepsilon>0δ>0\exists\delta>0,当 PU˚(P0,δ)DP\in\mathring U(P_0,\delta)\cap D 时,满足

f(P)A<ε|f(P)-A|<\varepsilon

则称 ffDD 上当 PP0P\to P_0 时的极限为 AA,记作

limPP0PDf(P)=A\lim_{P\to P_0\atop P\in D}f(P)=A

二元函数的极限也被称为二重极限

推论 1: EDE\subset DP0P_0EE 中的聚点,若 limPP0PEf(P)\lim\limits_{P\to P_0\atop P\in E}f(P) 不存在,则 limPP0PDf(P)\lim\limits_{P\to P_0\atop P\in D}f(P) 也不存在。

推论 2: E1,E2DE_1,E_2\subset DP0P_0 是它们的聚点,若 limPP0PE1f(P)=A1\lim\limits_{P\to P_0\atop P\in E_1}f(P)=A_1limPP0PE2f(P)=A2\lim\limits_{P\to P_0\atop P\in E_2}f(P)=A_2,并且 A1A2A_1\neq A_2,则 limPP0PDf(P)\lim\limits_{P\to P_0\atop P\in D}f(P) 不存在。

推论 3: limPP0PDf(P)\lim\limits_{P\to P_0\atop P\in D}f(P) 存在的充要条件是,在 DD 中存在点列 P1,P2,,Pn (PnP0)P_1,P_2,\cdots,P_n\ (P_n\neq P_0),并且 limnPn=P0\lim\limits_{n\to\infty}P_n=P_0,使得数列 {f(Pn)}\{f(P_n)\} 收敛。

非正常极限:

ff 是定义在 DR2D\subset\mathbb R^2 上的二元函数,P0P_0DD 中的一个聚点,若 M>0\forall M>0ε>0\exists\varepsilon>0,当 PU˚(P0,δ)DP\in\mathring U(P_0,\delta)\cap D 时,满足

f(P)>M|f(P)|>M

此时称 ffDD 上当 PP0P\to P_0 时有非正常极限,记作:

limPP0PDf(P)= (+ 或 )\lim_{P\to P_0\atop P\in D}f(P)=\infty\ (+\infty\ \text{或}\ -\infty)

f 在 D 上无界    {Pk}D, 使 limkf(Pk)=f\ \text{在}\ D\ \text{上无界}\iff\exists\{P_k\}\subset D,\ \text{使}\ \lim_{k\to\infty}f(P_k)=\infty

极限的四则运算:

设当 PP0P\to P_0 时,极限 limPP0f(P),limPP0g(P)\lim\limits_{P\to P_0}f(P),\lim\limits_{P\to P_0}g(P) 存在,则

  1. limPP0[f(P)±g(P)]=limPP0f(P)±limPP0g(P)\displaystyle\lim_{P\to P_0}[f(P)\pm g(P)]=\lim_{P\to P_0}f(P)\pm \lim_{P\to P_0}g(P)
  2. 对任意常数 cclimPP0cf(P)=climPP0f(P)\displaystyle\lim_{P\to P_0}cf(P)=c\lim_{P\to P_0}f(P)
  3. limPP0f(P)g(P)=limPP0f(P)limPP0g(P)\displaystyle\lim_{P\to P_0}f(P)g(P)=\lim_{P\to P_0}f(P)\cdot \lim_{P\to P_0}g(P)
  4. limPP0g(P)0\lim\limits_{P\to P_0}g(P)\neq 0 时,

limPP0f(P)g(P)=limPP0f(P)limPP0g(P)\displaystyle\lim_{P\to P_0}\frac{f(P)}{g(P)}=\frac{\lim\limits_{P\to P_0}f(P)}{\lim\limits_{P\to P_0}g(P)}

复合函数的极限:

  1. u=f(P)u=f(P) 是定义在 DD 上的二元函数,值域为 f(D)f(D),极限 limPP0f(P)=A\lim\limits_{P\to P_0}f(P)=A
  2. z=φ(u)z=\varphi(u) 是定义在 II 上的一元函数,极限 limuAφ(u)=B\lim\limits_{u\to A}\varphi(u)=B
  3. f(D)If(D)\subset I,且对于 DD 中的点 P0P_0 附近的点 PP0P\neq P_0f(P)Af(P)\neq A,则

limPP0φ[f(P)]=B\lim_{P\to P_0}\varphi[f(P)]=B

利用定义求二重极限:

例:证明 lim(x,y)(0,0)(xsin1y+ysin1x)=0\lim\limits_{(x,y)\to(0,0)}(x\sin\dfrac{1}{y}+y\sin\dfrac{1}{x})=0.

证:f(x,y)=xsin1y+ysin1xf(x,y)=x\sin\dfrac{1}{y}+y\sin\dfrac{1}{x} 的定义域为 D={(x,y)x0,y0}D=\{(x,y)\mid x\neq 0,y\neq 0\}P0(0,0)P_0(0,0)DD 的聚点。因为当 x0,y0x\neq 0,y\neq 0

f(x,y)0=xsin1y+ysin1xx+y2x2+y2|f(x,y)-0|=|x\sin\dfrac{1}{y}+y\sin\dfrac{1}{x}|\leq |x|+|y|\leq 2\sqrt{x^2+y^2}

ε>0\forall\varepsilon>0,取 δ=12ε\delta=\dfrac{1}{2}\varepsilon,则当 (x,y)D(x,y)\in D,且 0<x2+y2<δ0<\sqrt{x^2+y^2}<\delta 时,有

f(x,y)0<ε|f(x,y)-0|<\varepsilon

lim(x,y)(0,0)(xsin1y+ysin1x)=0\lim\limits_{(x,y)\to(0,0)}(x\sin\dfrac{1}{y}+y\sin\dfrac{1}{x})=0.

利用一元函数极限求二重极限:

例:求极限 lim(x,y)(0,0)(x+y)ln(x2+y2)\lim\limits_{(x,y)\to(0,0)}(x+y)\ln(x^2+y^2).

解:设 0x2+y210\leq x^2+y^2\leq 1,则

lnx2ln(x2+y2)0,lny2ln(x2+y2)0,\ln x^2\leq\ln(x^2+y^2)\leq 0,\quad\ln y^2\leq\ln(x^2+y^2)\leq 0,

从而

lnx2ln(x2+y2),lny2ln(x2+y2)|\ln x^2|\geq|\ln(x^2+y^2)|,\quad|\ln y^2|\geq|\ln(x^2+y^2)|

于是

0(x+y)ln(x2+y2)xlnx2+ylny20\leq|(x+y)\ln(x^2+y^2)|\leq|x\ln x^2|+|y\ln y^2|

limx0xlnx2=0\lim\limits_{x\to 0}x\ln x^2=0limy0ylny2=0\lim\limits_{y\to 0}y\ln y^2=0
因此 lim(x,y)(0,0)(x+y)ln(x2+y2)=0\lim\limits_{(x,y)\to(0,0)}(x+y)\ln(x^2+y^2)=0.

利用极坐标求二重极限:

x=rcosφ, y=rsinφx=r\cos\varphi,\ y=r\sin\varphi,则 (x,y)(0,0)(x,y)\to(0,0) 时,r0r\to 0.

例:求极限 lim(x,y)(0,0)xyx2y2x2+y2\lim\limits_{(x,y)\to(0,0)}xy\dfrac{x^2-y^2}{x^2+y^2}.

解:

xyx2y2x2+y2=rcosφrsinφr2cos2φr2sin2φr2=12r2sin2φcos2φ=14r2sin4φlimr014r2sin4φ=0\begin{aligned} xy\frac{x^2-y^2}{x^2+y^2}&=r\cos\varphi r\sin\varphi\dfrac{r^2\cos^2\varphi-r^2\sin^2\varphi}{r^2}\\ &=\frac{1}{2}r^2\sin 2\varphi\cos 2\varphi\\ &=\frac{1}{4}r^2\sin 4\varphi \end{aligned}\\ \lim_{r\to 0}\frac{1}{4}r^2\sin 4\varphi=0

综上所述,lim(x,y)(0,0)xyx2y2x2+y2=0\lim\limits_{(x,y)\to(0,0)}xy\dfrac{x^2-y^2}{x^2+y^2}=0.

证明二重极限不存在:

若自变量 xxyy 在取不同关系时,原式求出的极限值不同,则其二重极限不存在。

例:设 f(x,y)=x2yx4+y2f(x,y)=\dfrac{x^2y}{x^4+y^2},证明当 (x,y)(0,0)(x,y)\to(0,0) 时,f(x,y)f(x,y) 的极限不存在。

证:沿着 xx 轴和 yy 轴趋于 (0,0)(0,0) 时,有

lim(x,0)(0,0)x2yx4+y2=0,lim(0,y)(0,0)x2yx4+y2=0\lim_{(x,0)\to(0,0)}\frac{x^2y}{x^4+y^2}=0,\quad\lim_{(0,y)\to(0,0)}\frac{x^2y}{x^4+y^2}=0

沿着直线 y=kx (k0)y=kx\ (k\neq 0),也有

lim(x,kx)(0,0)x2yx4+y2=limx0kx3x4+k2x2=0\lim_{(x,kx)\to(0,0)}\frac{x^2y}{x^4+y^2}=\lim_{x\to 0}\frac{kx^3}{x^4+k^2x^2}=0

但是,沿着抛物线 y=kx2 (k0)y=kx^2\ (k\neq 0),有

lim(x,kx2)(0,0)x2yx4+y2=limx0kx4x4+k2x4=k1+k20\lim_{(x,kx^2)\to(0,0)}\frac{x^2y}{x^4+y^2}=\lim_{x\to 0}\frac{kx^4}{x^4+k^2x^4}=\frac{k}{1+k^2}\neq 0

综上所述,当 (x,y)(0,0)(x,y)\to(0,0) 时,f(x,y)f(x,y) 的极限不存在。

累次极限

设函数 f(x,y)f(x,y),若对任一固定的 yy0y\neq y_0,存在极限 limxx0f(x,y)=φ(y)\lim\limits_{x\to x_0}f(x,y)=\varphi(y),且存在极限 limyy0φ(y)=A\lim\limits_{y\to y_0}\varphi(y)=A,则称 AAf(x,y)f(x,y) 在点 (x0,y0)(x_0,y_0) 处先对 xx 后对 yy二次极限,记作:

limyy0limxx0f(x,y)=A\lim_{y\to y_0}\lim_{x\to x_0}f(x,y)=A

定理:f(x,y)f(x,y) 在点 (x0,y0)(x_0,y_0) 处的二重极限及两个二次极限都存在时,它们必相等,即

lim(x,y)(x0,y0)f(x,y)=limyy0limxx0f(x,y)=limxx0limyy0f(x,y)\lim_{(x,y)\to (x_0,y_0)}f(x,y)=\lim_{y\to y_0}\lim_{x\to x_0}f(x,y)=\lim_{x\to x_0}\lim_{y\to y_0}f(x,y)

二元函数的连续性

ff 是定义在 DR2D\subset\mathbb R^2 上的二元函数,P0DP_0\in D,若 ε>0\forall\varepsilon>0δ>0\exists\delta>0,对于 PU(P0,δ)DP\in U(P_0,\delta)\cap D,有 f(P)f(P0)<ε|f(P)-f(P_0)|<\varepsilon,则函数 ff 在点 P0P_0 处连续,此时称 P0P_0ff连续点,否则称其为间断点

  • P0P_0 为孤立点,则仅存在 P0U(P0,δ)DP_0\in U(P_0,\delta)\cap DP0P_0 必为连续点。
  • P0P_0 为聚点,当 P0P_0 处有定义且存在极限,并且 limPP0f(P)=f(P)\lim\limits_{P\to P_0}f(P)=f(P) 时,P0P_0 为连续点。

在上述函数中,设 P0(x0,y0)P_0(x_0,y_0),在 x0,y0x_0,y_0 分别取得增量 Δx,Δy\Delta x,\Delta y,且 P(x0+Δx,y0+Δy)U(P0)P(x_0+\Delta x,y_0+\Delta y)\in U(P_0),则相应的函数有增量

Δz=f(x0+Δx,y0+Δy)f(x0,y0)\Delta z=f(x_0+\Delta x,y_0+\Delta y)-f(x_0,y_0)

Δz\Delta z 为函数 z=f(x,y)z=f(x,y) 在点 P0(x0,y0)P_0(x_0,y_0) 处的全增量(full increment)。用全增量刻画函数在点 P0P_0 处的连续性,可以表示为:

lim(Δx,Δy)(0,0)Δz=lim(Δx,Δy)(0,0)f(x0+Δx,y0+Δy)f(x0,y0)=0\lim_{(\Delta x,\Delta y)\to(0,0)}\Delta z=\lim_{(\Delta x,\Delta y)\to(0,0)}f(x_0+\Delta x,y_0+\Delta y)-f(x_0,y_0)=0

复合函数的连续性:

u=φ(x,y),v=ψ(x,y)u=\varphi(x,y),v=\psi(x,y)x,yx,y 平面上,在 U(P0)U(P_0) 上有定义,且在 P0(x0,y0)P_0(x_0,y_0) 处连续;f(u,v)f(u,v)u,vu,v 平面上,在 U(Q0)U(Q_0) 上有定义,且在 Q0(u0,v0)Q_0(u_0,v_0) 处连续,其中 u0=φ(x0,y0)u_0=\varphi(x_0,y_0)v0=ψ(x0,y0)v_0=\psi(x_0,y_0),则 g(x,y)=f[φ(x,y),ψ(x,y)]g(x,y)=f[\varphi(x,y),\psi(x,y)]P0P_0 处连续。

多元初等函数的连续性:

任何一个定义在较低维空间的函数,总可以看成是一个定义在较高维空间上的函数:

f(x)=1x2,x[1,1]f(x,y)=1x2+0y,(x,y)[1,1]×Rf(x,y,z)=1x2+0z+0y,(x,y,z)[1,1]×R2\begin{aligned} f(x)&=\sqrt{1-x^2},\quad &x&\in[-1,1]\\ f(x,y)&=\sqrt{1-x^2}+0\cdot y,\quad &(x,y)&\in[-1,1]\times\mathbb R\\ f(x,y,z)&=\sqrt{1-x^2+0\cdot z}+0\cdot y,\quad &(x,y,z)&\in[-1,1]\times\mathbb R^2 \end{aligned}

可以证明,若一元函数 f(x)f(x) 在定义域上连续,则其对应的多元函数也在相应的定义域上连续。

多元初等函数是指由常数及具有不同自变量的一元基本初等函数经过有限次四则运算和复合得到的,并且能用一个算式表达的多元函数。一切多元初等函数在其定义域内都是连续的

有界闭域上连续二元函数的性质

有界性定理:
若函数 f(x,y)f(x,y) 在有界闭域 DD 上连续,则它在 DD 上有界。即 M>0\exists M>0,使得 (x,y)D\forall(x,y)\in D,都有 f(x,y)M|f(x,y)|\leq M.

最值定理:
若函数 f(x,y)f(x,y) 在有界闭域 DD 上连续,则它在 DD 上必有最大值和最小值。即 (x1,y1),(x2,x2)D\exists(x_1,y_1),(x_2,x_2)\in D,使得 (x,y)D\forall(x,y)\in D,都有

f(x1,y1)f(x,y)f(x2,y2)f(x_1,y_1)\leq f(x,y)\leq f(x_2,y_2)

介值定理:
若函数 f(x,y)f(x,y) 在有界闭域 DD 上连续,则它必取得介于最大值 MM 和最小值 mm 之间的任何值。即 μ[m,M]\forall\mu\in[m,M],至少存在一点 (x,y)D(\overline x,\overline y)\in D,使得

f(x,y)=μf(\overline x,\overline y)=\mu

一致连续定理:
若函数 f(x,y)f(x,y) 在有界闭域 DD 上连续,则它在 DD一致连续。即 ε>0\forall\varepsilon>0δ>0\exists\delta>0,则 P(x1,y1),Q(x2,y2)D\forall P(x_1,y_1),Q(x_2,y_2)\in D,当 ρ(P,Q)<δ\rho(P,Q)<\delta 时,有

f(x1,y1)f(x2,y2)<ε|f(x_1,y_1)-f(x_2,y_2)|<\varepsilon

偏导数

偏导数的定义

设函数 z=f(x,y)z=f(x,y) 在点 P0(x0,y0)P_0(x_0,y_0) 的某邻域 U(P0)U(P_0) 内有定义,令 y=y0y=y_0,自变量 xxx0x_0 取得增量 Δx\Delta x,此时相应的函数增量被称为偏增量(partial increment)

Δxz=f(x0+Δx,y0)f(x0,y0)\Delta_x z=f(x_0+\Delta x,y_0)-f(x_0,y_0)

如果极限

limΔx0ΔxzΔx=limΔx0f(x0+Δx,y0)f(x0,y0)Δx\lim_{\Delta x\to 0}\frac{\Delta_x z}{\Delta x}=\lim_{\Delta x\to 0}\frac{f(x_0+\Delta x,y_0)-f(x_0,y_0)}{\Delta x}

存在,则称该极限为函数 z=f(x,y)z=f(x,y) 在点 P0P_0 处关于自变量 xx偏导数(partial derivative),记作

zx(x0,y0) 或 fx(x0,y0) 或 zx(x0,y0) 或 fx(x0,y0) 或 fx(x0,y0)\frac{\partial z}{\partial x}\bigg|_{(x_0,y_0)}\ \text{或}\ \frac{\partial f}{\partial x}\bigg|_{(x_0,y_0)}\ \text{或}\ z_x(x_0,y_0)\ \text{或}\ f_x(x_0,y_0)\ \text{或}\ f_x'(x_0,y_0)

x\dfrac{\partial}{\partial x}y\dfrac{\partial}{\partial y} 称为偏导算子(partial derivative operator)

关于自变量 yy 的偏导数也是类似的原理。

求偏导数的方法:

  1. 求关于 xx 的偏导数:视 yy 为常数,关于 xxff 求导。
  2. 求关于 yy 的偏导数:视 xx 为常数,关于 yyff 求导。

连续性和可偏导的关系:

f(x,y)f(x,y)(x0,y0)(x_0,y_0) 处关于 xx 可偏导的充要的条件是 f(x,y0)f(x,y_0)x0x_0 处可导,
f(x,y0)f(x,y_0)x0x_0 处连续,从而 f(x,y)f(x,y)(x0,y0)(x_0,y_0) 处关于 xx 连续。

f(x,y)f(x,y)(x0,y0)(x_0,y_0) 处关于 yy 可偏导的充要的条件是 f(x0,y)f(x_0,y)y0y_0 处可导,
f(x0,y)f(x_0,y)y0y_0 处连续,从而 f(x,y)f(x,y)(x0,y0)(x_0,y_0) 处关于 yy 连续。

偏导数的几何意义

函数 z=f(x,y)z=f(x,y) 在点 P0(x0,y0)P_0(x_0,y_0) 处可偏导。

M0(x0,y0,f(x0,y0))M_0(x_0,y_0,f(x_0,y_0)) 为曲面 z=f(x,y)z=f(x,y) 上一点,过点 M0M_0 作平面 y=y0y=y_0,与曲面相交得到一条去曲线,其方程为:

C1:{z=f(x,y)y=y0C_1:\begin{cases} z=f(x,y)\\ y=y_0 \end{cases}

偏导数 fx(x0,y0)f_x(x_0,y_0) 就是曲线 C1C_1 在点 M0M_0 处的切线相对 xx 轴的斜率;曲线 C1C_1 在点 M0M_0 的一个切向量为 Tx=(1,0,fx(x0,y0))\bm T_x=(1,0,f_x(x_0,y_0)).

同理,偏导数 fy(x0,y0)f_y(x_0,y_0) 是曲线 C2:{z=f(x,y)x=x0C_2:\begin{cases}z=f(x,y)\\x=x_0\end{cases} 在点 M0M_0 处的切线相对 yy 轴的斜率;曲线 C2C_2 在点 M0M_0 处的一个切向量为 Ty=(0,1,fy(x0,y0))\bm T_y=(0,1,f_y(x_0,y_0)).

高阶偏导数

设函数 x=f(x,y)x=f(x,y) 在区域 DD 内处处存在偏导数 fx(x,y)f_x(x,y)fy(x,y)f_y(x,y),如果这两个偏导数仍可偏导,则称它们的偏导数为 z=f(x,y)z=f(x,y)二阶偏导数。二阶偏导数共有四种,分别记作:

x(zx)=2zx2=2fx2=zxx=fxx(x,y) y(zx)=2zxy=2fxy=zxy=fxy(x,y) x(zy)=2zyx=2fyx=zyx=fyx(x,y) y(zy)=2zy2=2fy2=zyy=fyy(x,y)\frac{\partial}{\partial x}(\frac{\partial z}{\partial x})=\frac{\partial^2 z}{\partial x^2}=\frac{\partial^2 f}{\partial x^2}=z_{xx}=f_{xx}(x,y)\\ \ \\ \frac{\partial}{\partial y}(\frac{\partial z}{\partial x})=\frac{\partial^2 z}{\partial x\partial y}=\frac{\partial^2 f}{\partial x\partial y}=z_{xy}=f_{xy}(x,y)\\ \ \\ \frac{\partial}{\partial x}(\frac{\partial z}{\partial y})=\frac{\partial^2 z}{\partial y\partial x}=\frac{\partial^2 f}{\partial y\partial x}=z_{yx}=f_{yx}(x,y)\\ \ \\ \frac{\partial}{\partial y}(\frac{\partial z}{\partial y})=\frac{\partial^2 z}{\partial y^2}=\frac{\partial^2 f}{\partial y^2}=z_{yy}=f_{yy}(x,y)

其中,2zx2\dfrac{\partial^2 z}{\partial x^2} 称为 zzxx 的二阶偏导数,2zy2\dfrac{\partial^2 z}{\partial y^2} 称为 zzyy 的二阶偏导数,2zxy\dfrac{\partial^2 z}{\partial x\partial y} 称为 zz 先对 xx 后对 yy 的二阶混合偏导数2zyx\dfrac{\partial^2 z}{\partial y\partial x} 称为 zz 先对 yy 后对 xx 的二阶混合偏导数。

定理: 若函数 f(x,y)f(x,y) 的两个二阶混合偏导数 fxy(x,y),fyx(x,y)f_{xy}(x,y),f_{yx}(x,y) 都在 (x,y)(x,y) 处连续,则

fxy(x,y)=fyx(x,y)f_{xy}(x,y)=f_{yx}(x,y)

推广:如果函数 f(x,y)f(x,y) 在区域 DD 内处处存在直到 kk 阶的所有偏导数,且所有这些偏导数都在 DD 内连续,则可记为 fC(k)(D)f\in C^{(k)}(D),并且 f(x,y)f(x,y)DD 内的 kk 阶混合偏导数与求偏导的次序无关。

多元函数微分学

全微分与偏微分

设函数 z=f(x,y)z=f(x,y) 在点 P0(x0,y0)P_0(x_0,y_0) 的某邻域 U(P0)U(P_0) 内有定义,如果函数在 P0P_0 处的全增量

Δz=f(x0+Δx,y0+Δy)f(x0,y0)\Delta z=f(x_0+\Delta x,y_0+\Delta y)-f(x_0,y_0)

可以表示为

Δz=AΔx+BΔy+o(ρ)\Delta z=A\Delta x+B\Delta y+o(\rho)

其中 A,BA,B 是不依赖于 Δx,Δy\Delta x,\Delta y 的常数(但一般与 x0,y0x_0,y_0 有关),ρ=Δx2+Δy2\rho=\sqrt{\Delta x^2+\Delta y^2},则称函数 z=f(x,y)z=f(x,y) 在点 P0P_0可微(differentiable),称其线性主部 AΔx+BΔyA\Delta x+B\Delta y 为函数在 P0P_0 处的全微分(total differentiation),记作 dz\mathrm{d}z,即

dz=AΔx+BΔy\mathrm{d}z=A\Delta x+B\Delta y

当函数在区域 DD 内每一点都可微时,称其为 DD 内的可微函数。若可微函数 ff 的偏导数在区域 DD 内仍然可微,则称 ff 在区域 DD连续可微(continuously differentiable)

与全微分相对的,还有偏微分。如果函数在 P0P_0 处关于自变量 xx 的偏增量

Δxz=f(x0+Δx,y0)f(x0,y0)\Delta_xz=f(x_0+\Delta x,y_0)-f(x_0,y_0)

可以表示为

Δxz=AΔx+o(Δx)\Delta_xz=A\Delta x+o(|\Delta x|)

称其线性主部 AΔxA\Delta x 为函数在 P0P_0 处关于自变量 xx偏微分(partial differentiation),偏微分与偏导数可以联系起来:

AΔx=fx(x0,y0)ΔxA\Delta x=f_x(x_0,y_0)\Delta x

利用全微分进行近似计算:

若函数 z=f(x,y)z=f(x,y) 在点 P0(x0,y0)P_0(x_0,y_0) 处可微,并且 Δx,Δy|\Delta x|,|\Delta y| 很小时,可以忽略高阶无穷小项,因此有近似等式:

f(x0+Δx,y0+Δy)f(x0,y0)AΔx+BΔyf(x_0+\Delta x,y_0+\Delta y)-f(x_0,y_0)\approx A\Delta x+B\Delta y

f(x0+Δx,y0+Δy)f(x0,y0)+AΔx+BΔyf(x_0+\Delta x,y_0+\Delta y)\approx f(x_0,y_0)+A\Delta x+B\Delta y

二元函数中值定理

第一种形式:
设函数 z=f(x)z=f(x) 在矩形域 D={(x,y)xx0<r1,yy0<r2}D=\{(x,y)\mid|x-x_0|<r_1,|y-y_0|<r_2\} 内有定义,若 f(x,y)f(x,y)DD 内可偏导,则对任意 Δx<r1,Δy<r2|\Delta x|<r_1,|\Delta y|<r_2,存在 0<θ1,θ2<10<\theta_1,\theta_2<1,使得

Δz=f(x0+Δx,y0+Δy)f(x0,y0)=fx(x0+θ1Δx,y0+Δy)Δx+fy(x0+Δx,y0+θ2Δy)Δy\begin{aligned} \Delta z&=f(x_0+\Delta x,y_0+\Delta y)-f(x_0,y_0)\\ &=f_x(x_0+\theta_1\Delta x,y_0+\Delta y)\Delta x+f_y(x_0+\Delta x,y_0+\theta_2\Delta y)\Delta y \end{aligned}

证明:

Δz=[f(x0+Δx,y0+Δy)f(x0,y0+Δy)]+[f(x0,y0+Δy)f(x0,y0)]\begin{aligned} \Delta z&=[f(x_0+\Delta x,y_0+\Delta y)-f(x_0,y_0+\Delta y)]\\ &+[f(x_0,y_0+\Delta y)-f(x_0,y_0)] \end{aligned}

(x,y0+Δt)(x,y_0+\Delta t) 在区域 DD 内,所以一元函数 φ(x)=f(x,y0+Δy)\varphi(x)=f(x,y_0+\Delta y)xx 的导数在 [x0,x0+Δx][x_0,x_0+\Delta x] 上处处存在。

由拉格朗日中值定理,存在 0<θ1<10<\theta_1<1,使得

f(x0+Δx,y0+Δy)f(x0,y0+Δy)=φ(x0+Δx)φ(x0)=φ(x0+θ1Δx)Δx=fx(x0+θ1Δx,y0+Δy)Δx\begin{aligned} f(x_0+\Delta x,y_0+\Delta y)-f(x_0,y_0+\Delta y)&=\varphi(x_0+\Delta x)-\varphi(x_0)\\ &=\varphi'(x_0+\theta_1\Delta x)\Delta x\\ &=f_x(x_0+\theta_1\Delta x,y_0+\Delta y)\Delta x \end{aligned}

同理,存在 0<θ2<10<\theta_2<1,使得

f(x0,y0+Δy)f(x0,y0)=fy(x0,y0+θ2Δy)Δyf(x_0,y_0+\Delta y)-f(x_0,y_0)=f_y(x_0,y_0+\theta_2\Delta y)\Delta y

综上,可证得上述结论成立。

推论 1: 设函数 z=f(x)z=f(x) 在矩形域 DD 内可偏导,且两个偏导数都恒等于零,则在 DDf(x,y)f(x,y) 为一常数。

推论 2: 设函数 z=f(x)z=f(x) 在矩形域 D={(x,y)xx0<r1,yy0<r2}D=\{(x,y)\mid|x-x_0|<r_1,|y-y_0|<r_2\} 内可偏导,且两个偏导数都有界,则 f(x,y)f(x,y) 在点 (x0,y0)(x_0,y_0) 处连续。

第二种形式:
设函数 z=f(x)z=f(x) 在凸开域 DR2D\subset\R^2 内可微,则对任意 P(a,b),Q(a+h,b+k)DP(a,b),Q(a+h,b+k)\in D,存在 0<θ<10<\theta<1,使得

Δz=f(a+h,b+k)f(a,b)=fx(a+θh,b+θk)h+fy(a+θh,b+θk)k\begin{aligned} \Delta z&=f(a+h,b+k)-f(a,b)\\ &=f_x(a+\theta h,b+\theta k)h+f_y(a+\theta h,b+\theta k)k \end{aligned}

证明:

φ(t)=f(a+th,b+tk)\varphi(t)=f(a+th,b+tk),它是定义在 [0,1][0,1] 上的一元函数,在 [0,1][0,1] 上连续并且可微,由拉格朗日中值定理,存在 0<θ<10<\theta<1,使得

f(a+h,b+k)=φ(1)φ(0)=φ(θ)f(a+h,b+k)=\varphi(1)-\varphi(0)=\varphi'(\theta)

由复合函数求导法则,可得

φ(θ)=fx(a+θh,b+θk)h+fy(a+θh,b+θk)k\varphi'(\theta)=f_x(a+\theta h,b+\theta k)h+f_y(a+\theta h,b+\theta k)k

又因为 DD 使凸区域,所以 (a+θh,b+θk)D(a+\theta h,b+\theta k)\in D,可证得上述结论成立。

二元函数的可微性条件

和一元函数不同,多元函数在一点处连续与可偏导没有蕴涵关系,即连续不一定可偏导,可偏导也不一定连续,我们可以通过必要条件和充分条件来判断函数的可微性。

可微的必要条件:
若函数 z=f(x,y)z=f(x,y) 在点 P0(x0,y0)P_0(x_0,y_0) 处可微,则

  1. f(x,y)f(x,y) 在点 P0P_0 处连续;
  2. f(x,y)f(x,y) 在点 P0P_0 处可偏导,且有 A=fx(x0,y0),B=fy(x0,y0)A=f_x(x_0,y_0),B=f_y(x_0,y_0),即

dz=fx(x0,y0)Δx+fy(x0,y0)Δy\mathrm{d}z=f_x(x_0,y_0)\Delta x+f_y(x_0,y_0)\Delta y

证明:

由函数 z=f(x,y)z=f(x,y) 可微,得

Δz=AΔx+BΔy+o(ρ)\Delta z=A\Delta x+B\Delta y+o(\rho)

(x0,y0)(0,0)(x_0,y_0)\to(0,0),则

lim(x0,y0)(0,0)o(ρ)=lim(x0,y0)(0,0)o(ρ)ρΔx2+Δy2=0\lim_{(x_0,y_0)\to(0,0)}o(\rho)=\lim_{(x_0,y_0)\to(0,0)}\frac{o(\rho)}{\rho}\sqrt{\Delta x^2+\Delta y^2}=0

lim(x0,y0)(0,0)Δz=0\lim\limits_{(x_0,y_0)\to(0,0)}\Delta z=0,即 f(x,y)f(x,y) 在点 P0P_0 处连续;

特别地,取 Δy=0\Delta y=0,则

f(x0+Δx,y0)f(x0,y0)=AΔx+o(Δx)f(x0+Δx,y0)f(x0,y0)Δx=A+o(Δx)Δx\begin{aligned} f(x_0+\Delta x,y_0)-f(x_0,y_0)&=A\Delta x+o(|\Delta x|)\\ \frac{f(x_0+\Delta x,y_0)-f(x_0,y_0)}{\Delta x}&=A+\frac{o(|\Delta x|)}{\Delta x} \end{aligned}

又因为

limΔx0o(Δx)Δx=limΔx0o(Δx)ΔxΔxΔx=0\lim_{\Delta x\to 0}\frac{o(|\Delta x|)}{\Delta x}=\lim_{\Delta x\to 0}\frac{o(|\Delta x|)}{|\Delta x|}\frac{|\Delta x|}{\Delta x}=0

于是

A=limΔx0f(x0+Δx,y0)f(x0,y0)Δx=fx(x0,y0)A=\lim_{\Delta x\to 0}\frac{f(x_0+\Delta x,y_0)-f(x_0,y_0)}{\Delta x}=f_x(x_0,y_0)

同理可得

B=limΔx0f(x0,y0+Δy)f(x0,y0)Δy=fy(x0,y0)B=\lim_{\Delta x\to 0}\frac{f(x_0,y_0+\Delta y)-f(x_0,y_0)}{\Delta y}=f_y(x_0,y_0)

可微的充分条件:
设函数 z=f(x,y)z=f(x,y) 在点 P0(x0,y0)P_0(x_0,y_0) 的某邻域 U(P0)U(P_0) 内可偏导,若其偏导数 fx(x,y),fy(x,y)f_x(x,y),f_y(x,y) 都在点 P0P_0 处连续,则函数 z=f(x,y)z=f(x,y) 在点 P0P_0 处可微。

证明:

由微分中值定理,对充分小的 Δx,Δy\Delta x,\Delta y,有

Δz=fx(x0+θ1Δx,y0+Δy)Δx+fy(x0+Δx,y0+θ2Δy)Δy(0<θ1,θ2<0)\Delta z=f_x(x_0+\theta_1\Delta x,y_0+\Delta y)\Delta x+f_y(x_0+\Delta x,y_0+\theta_2\Delta y)\Delta y\quad(0<\theta_1,\theta_2<0)

再由 fx(x,y),fy(x,y)f_x(x,y),f_y(x,y) 在点 (x0,y0)(x_0,y_0) 处连续,有

fx(x0+θ1Δx,y0+Δy)=fx(x0,y0)+αf_x(x_0+\theta_1\Delta x,y_0+\Delta y)=f_x(x_0,y_0)+\alpha

从而

Δz=fx(x0,y0)Δx+fy(x0,y0)Δy+αΔx+βΔy\Delta z=f_x(x_0,y_0)\Delta x+f_y(x_0,y_0)\Delta y+\alpha\Delta x+\beta\Delta y

又因为

αΔx+βΔyραΔxρ+βΔyρα+β\left|\frac{\alpha\Delta x+\beta\Delta y}{\rho}\right|\leq|\alpha|\left|\frac{\Delta x}{\rho}\right|+|\beta|\left|\frac{\Delta y}{\rho}\right|\leq|\alpha|+|\beta|

所以 lim(ΔxΔy)(0,0)αΔx+βΔyρ=0\lim\limits_{(\Delta x\Delta y)\to(0,0)}\dfrac{\alpha\Delta x+\beta\Delta y}{\rho}=0,即 αΔx+βΔy\alpha\Delta x+\beta\Delta yρ\rho 的高阶无穷小,从而

Δz=fx(x0,y0)Δx+fy(x0,y0)Δy+o(ρ)\Delta z=f_x(x_0,y_0)\Delta x+f_y(x_0,y_0)\Delta y+o(\rho)

证得 z=f(x,y)z=f(x,y) 在点 P0P_0 处可微。

可微性的几何意义:

二元函数 z=f(x,y)z=f(x,y)P0(x0,y0)P_0(x_0,y_0) 处可微的充要条件是在三维空间中存在点 (x0,y0,f(x0,y0))(x_0,y_0,f(x_0,y_0))切平面,并且该平面不平行于 zz 轴。

该切平面方程可以表示为:

zz0=fx(x0,y0)(xx0)+fy(x0,y0)(yy0)z-z_0=f_x(x_0,y_0)(x-x_0)+f_y(x_0,y_0)(y-y_0)

该切平面的法线方程可以表示为:

xx0fx(x0,y0)=yy0fy(x0,y0)=zz01\frac{x-x_0}{f_x(x_0,y_0)}=\frac{y-y_0}{f_y(x_0,y_0)}=\frac{z-z_0}{-1}

详见后文“曲面的切平面与法线”。

高阶全微分

设二元函数 z=f(x,y)z=f(x,y) 在点 (x,y)(x,y) 处可微,则

dz=fx(x,y)dx+fy(x,y)dy\mathrm{d}z=f_x(x,y)\mathrm{d}x+f_y(x,y)\mathrm{d}y

dz\mathrm{d}z 作为 (x,y)(x,y) 的函数仍可微,则称函数 f(x,y)f(x,y) 在点 (x,y)(x,y)二阶可微,并称 dz\mathrm{d}z 的微分为 z=f(x,y)z=f(x,y)二阶全微分,记作 d2z\mathrm{d}^2z,即

d2z=d(dz)=d[fx(x,y)dx+fy(x,y)dy]=dfx(x,y)dx+dfy(x,y)dy\begin{aligned} \mathrm{d}^2z=\mathrm{d}(\mathrm{d}z)&=\mathrm{d}[f_x(x,y)\mathrm{d}x+f_y(x,y)\mathrm{d}y]\\ &=\mathrm{d}f_x(x,y)\cdot\mathrm{d}x+\mathrm{d}f_y(x,y)\cdot\mathrm{d}y \end{aligned}

fxy(x,y)f_xy(x,y)fxy(x,y)f_xy(x,y) 都连续时,则有

d2z=fxx(x,y)dx2+2fxy(x,y)dxdy+fyy(x,y)dy2\mathrm{d}^2z=f_{xx}(x,y)\mathrm{d}x^2+2f_{xy}(x,y)\mathrm{d}x\mathrm{d}y+f_{yy}(x,y)\mathrm{d}y^2

若使用偏导算子符号,则上式可以写作:

d2z=2fx2dx2+22fxydxdy+2fy2dy2\mathrm{d}^2z=\frac{\partial^2f}{\partial x^2}\mathrm{d}x^2+2\frac{\partial^2f}{\partial x\partial y}\mathrm{d}x\mathrm{d}y+\frac{\partial^2f}{\partial y^2}\mathrm{d}y^2

z=f(x,y)z=f(x,y)n1n-1 阶全微分 dn1z\mathrm{d}^{n-1}z 仍可微,则称函数在点 f(x,y)f(x,y) 在点 (x,y)(x,y)n\bm n 阶可微,并称 n1n-1 阶全微分 dn1z\mathrm{d}^{n-1}z 的微分为 z=f(x,y)z=f(x,y)n\bm n 阶全微分,记作 dnz\mathrm{d}^nz

z=f(x,y)z=f(x,y) 的所有 nn 阶偏导数都连续时,有

dnz=(dxx+dyy)nf(x,y)=k=0nCnknzxkynkdxkdynk\begin{aligned} \mathrm{d}^nz&=\left(\mathrm{d}x\frac{\partial}{\partial x}+\mathrm{d}y\frac{\partial}{\partial y}\right)^nf(x,y)\\ &=\sum_{k=0}^nC_n^k\frac{\partial^nz}{\partial x^k\partial y^{n-k}}\mathrm{d}x^k\mathrm{d}y^{n-k} \end{aligned}

复合函数微分法

链式法则:

设函数 z=f(u,v)z=f(u,v)u=φ(t),v=ψ(t)u=\varphi(t),v=\psi(t) 可以构成复合函数 z=f[φ(t),ψ(t)]z=f[\varphi(t),\psi(t)],若 u=φ(t),v=ψ(t)u=\varphi(t),v=\psi(t) 都在点 tt 处可导,z=f(u,v)z=f(u,v) 在对应点 (u,v)(u,v) 处可微,则复合函数 z=f[φ(t),ψ(t)]z=f[\varphi(t),\psi(t)] 在点 tt 处可导,且

dzdt=zu(u,v)dudt+zv(u,v)dvdt\frac{\mathrm{d}z}{\mathrm{d}t}=\frac{\partial z}{\partial u}\bigg|_{(u,v)}\frac{\mathrm{d}u}{\mathrm{d}t}+\frac{\partial z}{\partial v}\bigg|_{(u,v)}\frac{\mathrm{d}v}{\mathrm{d}t}

证明:

由于函数 z=f(u,v)z=f(u,v) 可微,所以有

Δz=zuΔu+zvΔv+o(ρ)\Delta z=\frac{\partial z}{\partial u}\Delta u+\frac{\partial z}{\partial v}\Delta v+o(\rho)

上式两端同除 Δt\Delta t,得

ΔzΔt=zuΔuΔt+zvΔvΔt+o(ρ)Δt\frac{\Delta z}{\Delta t}=\frac{\partial z}{\partial u}\frac{\Delta u}{\Delta t}+\frac{\partial z}{\partial v}\frac{\Delta v}{\Delta t}+\frac{o(\rho)}{\Delta t}

由于 u=φ(t),v=ψ(t)u=\varphi(t),v=\psi(t) 都在点 tt 处可导,所以当 Δt0\Delta t\to 0 时,有

ΔuΔtdudt,ΔvΔtdvdt\frac{\Delta u}{\Delta t}\to\frac{\mathrm{d}u}{\mathrm{d}t},\quad\frac{\Delta v}{\Delta t}\to\frac{\mathrm{d}v}{\mathrm{d}t}

又因为 Δt0\Delta t\to 0 时,Δu0,Δv0\Delta u\to 0,\Delta v\to 0,所以有

limΔt0o(ρ)Δt=limΔt0o(ρ)ρρΔtΔtΔt=limΔt0o(ρ)ρ(ΔuΔt)2+(ΔvΔt)2ΔtΔt=0\begin{aligned} \lim_{\Delta t\to 0}\frac{o(\rho)}{\Delta t}&=\lim_{\Delta t\to 0}\frac{o(\rho)}{\rho}\frac{\rho}{|\Delta t|}\frac{|\Delta t|}{\Delta t}\\ &=\lim_{\Delta t\to 0}\frac{o(\rho)}{\rho}\sqrt{\left(\frac{\Delta u}{\Delta t}\right)^2+\left(\frac{\Delta v}{\Delta t}\right)^2}\frac{|\Delta t|}{\Delta t}=0 \end{aligned}

综上所述,可得

limΔt0ΔzΔt=zududt+zvdvdt\lim_{\Delta t\to 0}\frac{\Delta z}{\Delta t}=\frac{\partial z}{\partial u}\frac{\mathrm{d}u}{\mathrm{d}t}+\frac{\partial z}{\partial v}\frac{\mathrm{d}v}{\mathrm{d}t}

推论 1: 设函数 z=f(u,v)z=f(u,v)u=φ(s,t),v=ψ(s,t)u=\varphi(s,t),v=\psi(s,t) 可以构成复合函数 z=f[φ(s,t),ψ(s,t)]z=f[\varphi(s,t),\psi(s,t)],且满足链式法则使用条件,则复合函数 z=f[φ(s,t),ψ(s,t)]z=f[\varphi(s,t),\psi(s,t)] 在点 (s,t)(s,t) 处可偏导,且

zs=zuus+zvvs,zt=zuut+zvvt\frac{\partial z}{\partial s}=\frac{\partial z}{\partial u}\frac{\partial u}{\partial s}+\frac{\partial z}{\partial v}\frac{\partial v}{\partial s},\quad\frac{\partial z}{\partial t}=\frac{\partial z}{\partial u}\frac{\partial u}{\partial t}+\frac{\partial z}{\partial v}\frac{\partial v}{\partial t}

推论 2: 设函数 z=f(u,v)z=f(u,v)u=φ(s,t),v=ψ(t)u=\varphi(s,t),v=\psi(t) 可以构成复合函数 z=f[φ(s,t),ψ(t)]z=f[\varphi(s,t),\psi(t)],且满足链式法则使用条件,则复合函数 z=f[φ(s,t),ψ(t)]z=f[\varphi(s,t),\psi(t)] 在点 (s,t)(s,t) 处可偏导,且

zs=zuus,zt=zuut+zvdvdt\frac{\partial z}{\partial s}=\frac{\partial z}{\partial u}\frac{\partial u}{\partial s},\quad\frac{\partial z}{\partial t}=\frac{\partial z}{\partial u}\frac{\partial u}{\partial t}+\frac{\partial z}{\partial v}\frac{\mathrm{d}v}{\mathrm{d}t}

链式法则的推广: 一般地,设函数 z=f(y1,y2,,yn)z=f(y_1,y_2,\cdots,y_n)yi=yi(x1,x2,,xm) (i=1,2,,n)y_i=y_i(x_1,x_2,\cdots,x_m)\ (i=1,2,\cdots,n) 可以构成复合函数,若 yi=yi(x1,x2,,xm)y_i=y_i(x_1,x_2,\cdots,x_m) 在点 (x1,x2,,xm)(x_1,x_2,\cdots,x_m) 处可偏导,z=f(y1,y2,,yn)z=f(y_1,y_2,\cdots,y_n) 在对应点可微,则复合函数在点 (x1,x2,,xm)(x_1,x_2,\cdots,x_m) 处可偏导,且

zxi=j=1nzyjyjxi(i=1,2,,m)\frac{\partial z}{\partial x_i}=\sum_{j=1}^n\frac{\partial z}{\partial y_j}\frac{\partial y_j}{\partial x_i}\quad(i=1,2,\cdots,m)

复合函数微分和高阶偏导数结合:

例:设 z=f(xy,yx)z=f(xy,\dfrac y x),其中 ff 二阶可导,求 2zxy\dfrac{\partial^2 z}{\partial x\partial y}.

解:令 u=xy,v=yxu=xy,v=\dfrac y x,则复合函数是由 z=f(u,v)z=f(u,v)u=xyu=xyv=yxv=\dfrac y x 复合而成。

zx=fuux+fvvx=yf1yx2f2\frac{\partial z}{\partial x}=\frac{\partial f}{\partial u}\frac{\partial u}{\partial x}+\frac{\partial f}{\partial v}\frac{\partial v}{\partial x}=yf_1'-\frac{y}{x^2}f_2'

2zxy=f1+yyf11x2(f2+yf2)=f1+y(f11uy+f12vy)1x2[f2+y(f21uy+f22vy)]=f1+y(f11x+f121x)1x2f2yx2(f21x+f221x)=xyf11yx3f22+f11x2f2\begin{aligned} \frac{\partial^2 z}{\partial x\partial y}&=f_1'+y\frac\partial{\partial y}f_1'-\frac{1}{x^2}\left(f_2'+\frac\partial{\partial y}f_2'\right)\\ &=f_1'+y\left(f_{11}''\frac{\partial u}{\partial y}+f_{12}''\frac{\partial v}{\partial y}\right)-\frac{1}{x^2}\left[f_2'+y\left(f_{21}''\frac{\partial u}{\partial y}+f_{22}''\frac{\partial v}{\partial y}\right)\right]\\ &=f_1'+y\left(f_{11}''\cdot x+f_{12}''\cdot\frac 1 x\right)-\frac{1}{x^2}f_2'-\frac{y}{x^2}\left(f_{21}''\cdot x+f_{22}''\cdot\frac 1 x\right)\\ &=xyf_{11}''-\frac{y}{x^3}f_{22}''+f_1'-\frac{1}{x^2}f_2' \end{aligned}

一阶微分形式不变性:

设以 uuvv 为自变量的函数 z=f(u,v)z=f(u,v) 在点 (u,v)(u,v) 处可微,则其全微分为

dz=zudu+zvdv\mathrm{d}z=\frac{\partial z}{\partial u}\mathrm{d}u+\frac{\partial z}{\partial v}\mathrm{d}v

如果 u,vu,v 又是 x,yx,y 的函数 u=φ(x,y)u=\varphi(x,y)v=ψ(x,y)v=\psi(x,y),并且在点 (x,y)(x,y) 处可微,则复合函数 z=f[φ(x,y),ψ(x,y)]z=f[\varphi(x,y),\psi(x,y)] 在点 (x,y)(x,y) 处也可微,且

dz=zxdx+zydy=[zuux+zvvx]dx+[zuuy+zvvy]dy=zu[uxdx+uydy]+zv[vxdx+vydy]\begin{aligned} \mathrm{d}z=\frac{\partial z}{\partial x}\mathrm{d}x+\frac{\partial z}{\partial y}\mathrm{d}y&=\left[\frac{\partial z}{\partial u}\frac{\partial u}{\partial x}+\frac{\partial z}{\partial v}\frac{\partial v}{\partial x}\right]\mathrm{d}x+\left[\frac{\partial z}{\partial u}\frac{\partial u}{\partial y}+\frac{\partial z}{\partial v}\frac{\partial v}{\partial y}\right]\mathrm{d}y\\ &=\frac{\partial z}{\partial u}\left[\frac{\partial u}{\partial x}\mathrm{d}x+\frac{\partial u}{\partial y}\mathrm{d}y\right]+\frac{\partial z}{\partial v}\left[\frac{\partial v}{\partial x}\mathrm{d}x+\frac{\partial v}{\partial y}\mathrm{d}y\right] \end{aligned}

因为

du=uxdx+uydy,dv=vxdx+vydy\mathrm{d}u=\frac{\partial u}{\partial x}\mathrm{d}x+\frac{\partial u}{\partial y}\mathrm{d}y,\quad\mathrm{d}v=\frac{\partial v}{\partial x}\mathrm{d}x+\frac{\partial v}{\partial y}\mathrm{d}y

所以

dz=zudu+zvdv\mathrm{d}z=\frac{\partial z}{\partial u}\mathrm{d}u+\frac{\partial z}{\partial v}\mathrm{d}v

由此可知,无论 u,vu,v 是自变量还是中间变量,函数 z=f(u,v)z=f(u,v) 的全微分形式是一样的,这个性质被称为一阶微分形式不变性

利用一阶微分形式不变性,容易证明以下微分法则对于自变量和中间变量恒成立:

d(u±v)=du±dv,d(uv)=vdu+udv d(uv)=vduudvv2(v0)\mathrm{d}(u\pm v)=\mathrm{d}u\pm\mathrm{d}v,\quad\mathrm{d}(uv)=v\mathrm{d}u+u\mathrm{d}v\\ \ \\ \mathrm{d}\left(\frac{u}{v}\right)=\frac{v\mathrm{d}u-u\mathrm{d}v}{v^2}\quad(v\neq 0)

对于高阶全微分,不存在对应的形式不变性。

隐函数微分法

对于隐函数微分,我们一般有以下三个方法进行处理:

  1. 公式法:适用于求一阶偏导数的情况。
  2. 微分法:等式两端同时求全微分,适用于求关于多个变量的一阶偏导数的情况。
  3. 偏导法:等式两端同时求偏导数,适用于需要求高阶偏导数的情况。

由单个方程确定的隐函数的微分法:

隐函数存在定理(充分条件): 设二元函数 F(x,y)F(x,y) 满足

  1. 在点 P(x0,y0)P(x_0,y_0) 的某邻域内具有连续偏导数 Fx,FyF_x',F_y'
  2. F(x0,y0)=0F(x_0,y_0)=0Fy(x0,y0)0F_y(x_0,y_0)\neq 0.

则方程 F(x,y)=0F(x,y)=0(x0,y0)(x_0,y_0) 的某邻域内中可以确定唯一一个连续可导的隐函数 y=f(x)y=f(x),满足

F[x,f(x)]=0,f(x0)=y0F[x,f(x)]=0,\quad f(x_0)=y_0

并且其导数为

dydx=Fx(x,y)Fy(x,y)\frac{\mathrm{d}y}{\mathrm{d}x}=-\frac{F_x(x,y)}{F_y(x,y)}

推导:因为隐函数 y=f(x)y=f(x) 满足恒等式

F[x,f(x)]=0F[x,f(x)]=0

其中 FF(x0,y0)(x_0,y_0) 的某邻域内具有连续偏导数,f(x)f(x) 在点 x0x_0 的某邻域内连续可导,由链式法则,在恒等式两端对 xx 求导可得

Fx(x,y)+Fy(x,y)dydx=0F_x(x,y)+F_y(x,y)\frac{\mathrm{d}y}{\mathrm{d}x}=0

又因为存在 (x0,y0)(x_0,y_0) 的某邻域,使得在该邻域内 Fy(x,y)0F_y(x,y)\neq 0,所以

dydx=Fx(x,y)Fy(x,y)\frac{\mathrm{d}y}{\mathrm{d}x}=-\frac{F_x(x,y)}{F_y(x,y)}

隐函数存在定理推广: 设三元函数 F(x,y,z)F(x,y,z) 满足

  1. 在点 P(x0,y0,z0)P(x_0,y_0,z_0) 的某邻域内具有连续偏导数 Fx,Fy,FzF_x',F_y',F_z'
  2. F(x0,y0,z0)=0F(x_0,y_0,z_0)=0Fy(x0,y0,z0)0F_y(x_0,y_0,z_0)\neq 0.

则方程 F(x,y,z)=0F(x,y,z)=0(x0,y0)(x_0,y_0) 的某邻域内中可以确定唯一一个具有连续偏导数的隐函数 z=f(x,y)z=f(x,y),满足

F[x,y,f(x,y)]=0,f(x0,y0)=z0F[x,y,f(x,y)]=0,\quad f(x_0,y_0)=z_0

并且其偏导数为

zx=FxFz,zy=FyFz\frac{\partial z}{\partial x}=-\frac{F_x'}{F_z'},\quad\frac{\partial z}{\partial y}=-\frac{F_y'}{F_z'}

推导:在恒等式 F[x,y,f(x,y)]=0F[x,y,f(x,y)]=0 两端求微分得

Fxdx+Fydy+Fzdz=0F_x\mathrm{d}x+F_y\mathrm{d}y+F_z\mathrm{d}z=0

又因为在 Fz(x0,y0,z0)0F_z(x_0,y_0,z_0)\neq 0Fz(x,y,z)F_z(x,y,z) 连续,所以存在 (x0,y0,z0)(x_0,y_0,z_0) 的某邻域,使得在该邻域内 Fz(x,y,z)0F_z(x,y,z)\neq 0,从而

zx=FxFz,zy=FyFz\frac{\partial z}{\partial x}=-\frac{F_x'}{F_z'},\quad\frac{\partial z}{\partial y}=-\frac{F_y'}{F_z'}

由方程组确定的隐函数的微分法:

隐函数存在定理: 设三元函数 F(x,u,v),G(x,u,v)F(x,u,v),G(x,u,v) ,我们将 u,vu,v 看作因变量,xx 看作自变量,满足

  1. 在点 P0(x0,u0,v0)P_0(x_0,u_0,v_0) 的某邻域内具有对自变量 xx 的连续偏导数;
  2. F(x0,u0,v0)=0F(x_0,u_0,v_0)=0G(x0,u0,v0)=0G(x_0,u_0,v_0)=0
  3. 在点 P0P_0 处,存在行列式

J=FuFvGuGv0J=\begin{vmatrix}F_u'&F_v'\\G_u'&G_v'\end{vmatrix}\neq 0

该行列式称为雅可比行列式(Jacobian determinant),一般可以记作

(F,G)(u,v)=FuFvGuGv\frac{\partial(F,G)}{\partial(u,v)}=\begin{vmatrix}F_u'&F_v'\\G_u'&G_v'\end{vmatrix}

则方程组 {F(x,u,v)=0G(x,u,v)=0\begin{cases}F(x,u,v)=0\\G(x,u,v)=0\end{cases} 在点 P0P_0 的某邻域内可以确定唯一一对具有连续偏导数的一元函数 {u=u(x)v=v(x)\begin{cases}u=u(x)\\v=v(x)\end{cases},满足

{F(x,u(x),v(x))=0G(x,u(x),v(x))=0,{u(x0)=u0v(x0)=v0\begin{cases}F(x,u(x),v(x))=0\\G(x,u(x),v(x))=0\end{cases},\quad\begin{cases}u(x_0)=u_0\\v(x_0)=v_0\end{cases}

并且其导数为

dudx=FxFvGxGvFuFvGuGv,dvdx=FuFxGuGxFuFvGuGv\frac{\mathrm{d}u}{\mathrm{d}x}=-\frac{\begin{vmatrix}F_x'&F_v'\\G_x'&G_v'\end{vmatrix}}{\begin{vmatrix}F_u'&F_v'\\G_u'&G_v'\end{vmatrix}},\quad\frac{\mathrm{d}v}{\mathrm{d}x}=-\frac{\begin{vmatrix}F_u'&F_x'\\G_u'&G_x'\end{vmatrix}}{\begin{vmatrix}F_u'&F_v'\\G_u'&G_v'\end{vmatrix}}

推导:在恒等式 {F(x,u(x),v(x))=0G(x,u(x),v(x))=0\begin{cases}F(x,u(x),v(x))=0\\G(x,u(x),v(x))=0\end{cases} 两边取微分,得

{Fxdx+Fudu+Fvdv=0Gxdx+Gudu+Gvdv=0\begin{cases} F_x\mathrm{d}x+F_u\mathrm{d}u+F_v\mathrm{d}v=0\\ G_x\mathrm{d}x+G_u\mathrm{d}u+G_v\mathrm{d}v=0 \end{cases}

由于在点 P0P_0J0J\neq 0,并且 Fu,Fv,Gu,GvF_u,F_v,G_u,G_v 连续,所以存在 P0P_0 的某邻域,使得在该邻域内 J0J\neq 0,从而

du=1JFxdxFvGxdxGvdv=1JFuFxdxGuGxdx\mathrm{d}u=\frac 1 J \begin{vmatrix}-F_x'\mathrm{d}x&F_v'\\-G_x'\mathrm{d}x&G_v'\end{vmatrix}\\ \mathrm{d}v=\frac 1 J \begin{vmatrix}F_u'&-F_x'\mathrm{d}x\\G_u'&-G_x'\mathrm{d}x\end{vmatrix}

隐函数存在定理推广: 设四元函数 F(x,y,u,v),G(x,y,u,v)F(x,y,u,v),G(x,y,u,v) ,我们将 u,vu,v 看作因变量,x,yx,y 看作自变量,满足

  1. 在点 P0(x0,y0,u0,v0)P_0(x_0,y_0,u_0,v_0) 的某邻域内具有对每个自变量的连续偏导数;
  2. F(x0,y0,u0,v0)=0F(x_0,y_0,u_0,v_0)=0G(x0,y0,u0,v0)=0G(x_0,y_0,u_0,v_0)=0
  3. 在点 P0P_0 处,存在行列式

J=(F,G)(u,v)0J=\frac{\partial(F,G)}{\partial(u,v)}\neq 0

则方程组 {F(x,y,u,v)=0G(x,y,u,v)=0\begin{cases}F(x,y,u,v)=0\\G(x,y,u,v)=0\end{cases} 在点 P0P_0 的某邻域内可以确定唯一一对具有连续偏导数的二元函数 {u=u(x,y)v=v(x,y)\begin{cases}u=u(x,y)\\v=v(x,y)\end{cases},满足

{F(x,y,u(x,y),v(x,y))=0G(x,y,u(x,y),v(x,y))=0,{u(x0,y0)=u0v(x0,y0)=v0\begin{cases}F(x,y,u(x,y),v(x,y))=0\\G(x,y,u(x,y),v(x,y))=0\end{cases},\quad\begin{cases}u(x_0,y_0)=u_0\\v(x_0,y_0)=v_0\end{cases}

并且其偏导数为

ux=1J(F,G)(x,v),vx=1J(F,G)(u,x),uy=1J(F,G)(y,v),vy=1J(F,G)(u,y)\frac{\partial u}{\partial x}=-\frac 1 J\frac{\partial(F,G)}{\partial(x,v)},\quad\frac{\partial v}{\partial x}=-\frac 1 J\frac{\partial(F,G)}{\partial(u,x)},\\ \frac{\partial u}{\partial y}=-\frac 1 J\frac{\partial(F,G)}{\partial(y,v)},\quad\frac{\partial v}{\partial y}=-\frac 1 J\frac{\partial(F,G)}{\partial(u,y)}

例 1:设 F(x,y,xz,y2u)=0F(x,y,x-z,y^2-u)=0,其中 FF 拥有二阶连续偏导数,且 F40F_4'\neq 0,求 2uy2\dfrac{\partial^2u}{\partial y^2}.

解:把 uu 看作因变量,对方程两端关于自变量 yy 求偏导,得

F2+F4(2yuy)=0uy=2y+F2F4\begin{aligned} F_2'+F_4'\cdot(2y-u_y)&=0\\ u_y&=2y+\frac{F_2'}{F_4'} \end{aligned}

对第一次求偏导得到的等式两端再对 yy 求偏导,得

F22+F24(2yuy)+[F42+F44(2yuy)](2yuy)+F4(2uyy)=0F_{22}''+F_{24}''\cdot(2y-u_y)+[F_{42}''+F_{44}''\cdot(2y-u_y)](2y-u_y)+F_4'\cdot(2-u_{yy})=0

因为 FF 的二阶偏导数连续,所以 F24=F42F_{24}''=F_{42}'',代入 2yuy=F2F42y-u_y=-\dfrac{F_2'}{F_4'},可将上式转化为

F222F2F4F24+(F2F4)2F44+F4(2uyy)=0F_{22}''-2\frac{F_2'}{F_4'}F_{24}''+\left(\frac{F_2'}{F_4'}\right)^2F_{44}''+F_4'(2-u_{yy})=0

上式两端同除以 F4F_4',最终得到

2uy2=uyy=2+1F4F222F2F42F24+F22F43F44\dfrac{\partial^2u}{\partial y^2}=u_{yy}=2+\frac{1}{F_4'}F_{22}''-2\frac{F_2'}{F_4'^2}F_{24}''+\frac{F_2'^2}{F_4'^3}F_{44}''

例 2:设 u=f(x,y,xyz)u=f(x,y,xyz),函数 z=z(x,y)z=z(x,y) 由方程

exyz=xyzg(xy+zt)dte^{xyz}=\int_{xy}^zg(xy+z-t)\mathrm{d}t

确定,其中 ff 具有连续偏导数,gg 连续,求 xuxyuyx\dfrac{\partial u}{\partial x}-y\dfrac{\partial u}{\partial y}.

解:

ux=f1+f3(yz+xyzx)uy=f2+f3(xz+xyzy)\frac{\partial u}{\partial x}=f_1'+f_3'\cdot\left(yz+xy\frac{\partial z}{\partial x}\right)\\ \frac{\partial u}{\partial y}=f_2'+f_3'\cdot\left(xz+xy\frac{\partial z}{\partial y}\right)

w=xy+ztw=xy+z-t,则 t=w+xy+zt=-w+xy+z,原方程转化为

exyz=zxyg(w)d(w+xy+z)=xyzg(w)dwe^{xyz}=\int_z^{xy}g(w)\mathrm{d}(-w+xy+z)=\int_{xy}^zg(w)\mathrm{d}w

在方程两端同时对自变量 xx 求导,可得

exyz(yz+xyzx)=g(z)zxyg(xy)zx=yzexyz+yg(xy)g(z)xyexyz\begin{aligned} e^{xyz}(yz+xy\frac{\partial z}{\partial x})&=g(z)\frac{\partial z}{\partial x}-yg(xy)\\ \frac{\partial z}{\partial x}&=\frac{yze^{xyz}+yg(xy)}{g(z)-xye^{xyz}} \end{aligned}

同理可得

zy=xzexyz+xg(xy)g(z)xyexyz\frac{\partial z}{\partial y}=\frac{xze^{xyz}+xg(xy)}{g(z)-xye^{xyz}}

因此

xuxyuy=x[f1+f3(yz+xyyzexyz+yg(xy)g(z)xyexyz)]y[f2+f3(xz+xyxzexyz+xg(xy)g(z)xyexyz)]=xf1yf2\begin{aligned} x\frac{\partial u}{\partial x}-y\frac{\partial u}{\partial y}&=x\left[f_1'+f_3'\cdot\left(yz+xy\frac{yze^{xyz}+yg(xy)}{g(z)-xye^{xyz}}\right)\right]\\ &-y\left[f_2'+f_3'\cdot\left(xz+xy\frac{xze^{xyz}+xg(xy)}{g(z)-xye^{xyz}}\right)\right]\\ &=xf_1'-yf_2' \end{aligned}

雅可比行列式的性质:

链式法则: 设函数 zi=fi(u1,u2,,un) (i=1,2,,n)z_i=f_i(u_1,u_2,\cdots,u_n)\ (i=1,2,\cdots,n) 在区域 URnU\subset\R^n 内具有连续偏导数,而函数 uj=φj(x1,x2,,xn) (j=1,2,,n)u_j=\varphi_j(x_1,x_2,\cdots,x_n)\ (j=1,2,\cdots,n) 在区域 XRnX\subset\R^n 内具有连续偏导数,并且当 (x1,x2,,xn)X(x_1,x_2,\cdots,x_n)\in X 时,对应点 (u1,u2,,un)U(u_1,u_2,\cdots,u_n)\in U,则有

(z1,z2,,zn)(x1,x2,,xn)=(z1,z2,,zn)(u1,u2,,un)(u1,u2,,un)(x1,x2,,xn)\frac{\partial(z_1,z_2,\cdots,z_n)}{\partial(x_1,x_2,\cdots,x_n)}=\frac{\partial(z_1,z_2,\cdots,z_n)}{\partial(u_1,u_2,\cdots,u_n)}\cdot\frac{\partial(u_1,u_2,\cdots,u_n)}{\partial(x_1,x_2,\cdots,x_n)}

可逆性: 设函数 yi=fi(x1,x2,,xn) (i=1,2,,n)y_i=f_i(x_1,x_2,\cdots,x_n)\ (i=1,2,\cdots,n) 在区域 XRnX\subset\R^n 内具有连续偏导数,并且

J=(y1,y2,,yn)(x1,x2,,xn)0J=\frac{\partial(y_1,y_2,\cdots,y_n)}{\partial(x_1,x_2,\cdots,x_n)}\neq 0

则存在其反函数 xj=φj(y1,y2,,yn) (j=1,2,,n)x_j=\varphi_j(y_1,y_2,\cdots,y_n)\ (j=1,2,\cdots,n),同样在区域 XX 内具有连续偏导数,并且

(y1,y2,,yn)(x1,x2,,xn)(x1,x2,,xn)(y1,y2,,yn)=1\frac{\partial(y_1,y_2,\cdots,y_n)}{\partial(x_1,x_2,\cdots,x_n)}\cdot\frac{\partial(x_1,x_2,\cdots,x_n)}{\partial(y_1,y_2,\cdots,y_n)}=1

方向导数与梯度

方向导数

为了引出方向导数的概念,我们首先从二维的情形开始探讨。想象 l\bm l 为平面上的非零向量,其方向余弦(向量与坐标轴夹角的余弦值)cosα,cosβ\cos\alpha,\cos\beta,则 el=(cosα,cosβ)\bm e_l=(\cos\alpha,\cos\beta) 是与 l\bm l 同方向的单位向量。过平面上一点 P0(x0,y0)P_0(x_0,y_0),以 l\bm l 为方向向量作一条射线 LL,其参数方程为

{x=x0+tcosα,y=y0+tcosβ,0t<+\begin{cases} x=x_0+t\cos\alpha,\\ y=y_0+t\cos\beta, \end{cases}\quad 0\leq t<+\infty

P(x,y)=(x0+tcosα,y0+tcosβ)P(x,y)=(x_0+t\cos\alpha,y_0+t\cos\beta)LL 上任意一点,可以写出以下极限

limt0+f(P)f(P0)t\lim_{t\to 0^+}\frac{f(P)-f(P_0)}{t}

若当点 PP 沿着射线趋于 P0P_0 时该极限存在,那么该极限反映了函数在点 P0P_0 处沿方向 l\bm l 的变化率,这便是方向导数(directional derivative)

定义: 设函数 z=f(x1,,xn)z=f(x_1,\cdots,x_n) 在点 x\bm x 的某邻域 U(x)U(\bm x) 内有定义,l\bm l 是一非零向量,el\bm e_l 是与 l\bm l 同方向的单位向量,若极限

limt0+f(x+tel)f(x)t\lim_{t\to 0^+}\frac{f(\bm x+t\bm e_l)-f(\bm x)}{t}

存在,则称此极限值为函数 z=f(x1,,xn)z=f(x_1,\cdots,x_n) 在点 x\bm x 处沿方向 l\bm l方向导数,记作 flx\dfrac{\partial f}{\partial l}\bigg|_{\bm x},即

flx=limt0+f(x+tel)f(x)t\frac{\partial f}{\partial l}\bigg|_{\bm x}=\lim_{t\to 0^+}\frac{f(\bm x+t\bm e_l)-f(\bm x)}{t}

定理: 若函数 z=f(x1,,xn)z=f(x_1,\cdots,x_n) 在点 x\bm x 处可微,则沿着任意非零向量 l\bm l 的方向导数都存在,并且

flx=dfx(el)\frac{\partial f}{\partial l}\bigg|_{\bm x}=\mathrm{d}f_{\bm x}(\bm e_l)

该公式在二维情形下可以写作:

fl(x0,y0)=fx(x0,y0)cosα+fy(x0,y0)cosβ\frac{\partial f}{\partial l}\bigg|_{(x_0,y_0)}=f_x(x_0,y_0)\cos\alpha+f_y(x_0,y_0)\cos\beta

证明:

由于 f(x,y)f(x,y)(x0,y0)(x_0,y_0) 处可微,所以

f(x0+Δx,y0+Δy)f(x0,y0)=fx(x0,y0)Δx+fy(x0,y0)Δy+o(Δx2+Δy2)\begin{aligned} &\quad f(x_0+\Delta x,y_0+\Delta y)-f(x_0,y_0)\\ &=f_x(x_0,y_0)\Delta x+f_y(x_0,y_0)\Delta y+o(\sqrt{\Delta x^2+\Delta y^2}) \end{aligned}

(x0+Δx,y0+Δy)(x_0+\Delta x,y_0+\Delta y) 在以 (x0,y0)(x_0,y_0) 为起点,l\bm l 为方向的射线上时,有 Δx=tcosα,Δy=tcosβ\Delta x=t\cos\alpha,\Delta y=t\cos\beta,则

f(x0+tcosα,y0+tcosβ)f(x0,y0)=fx(x0,y0)tcosα+fy(x0,y0)tcosβ+o(t)\begin{aligned} &\quad f(x_0+t\cos\alpha,y_0+t\cos\beta)-f(x_0,y_0)\\ &=f_x(x_0,y_0)t\cos\alpha+f_y(x_0,y_0)t\cos\beta+o(t) \end{aligned}

从而

limt0+f(x0+tcosα,y0+tcosβ)f(x0,y0)t=fx(x0,y0)cosα+fy(x0,y0)cosβ\begin{aligned} &\quad\lim_{t\to 0^+}\frac{f(x_0+t\cos\alpha,y_0+t\cos\beta)-f(x_0,y_0)}{t}\\ &=f_x(x_0,y_0)\cos\alpha+f_y(x_0,y_0)\cos\beta \end{aligned}

梯度

在空间的每一个点都可以确定无限多个方向,一个多元函数在某个点也必然有无限多个方向导数。为了研究导数在这无限多个方向导数中最大的一个(它直接反映了函数在这个点的变化率的数量级),我们引入了梯度(gradient) 的概念。

定义: 设函数 z=f(x1,,xn)z=f(x_1,\cdots,x_n) 在点 x\bm x 处可偏导,则它在该点处的梯度定义为

(f(x))el=flx(\nabla f(\bm x))\cdot\bm e_l=\frac{\partial f}{\partial l}\bigg|_{\bm x}

其中 \nabla 为 Nabla 算子,f(x)\nabla f(\bm x) 表示函数 ff 在点 x\bm x 处的梯度,它的本质是一个向量。

在二维情形下,梯度的计算公式可以写成如下形式:

f(x0,y0)=fx(x0,y0)i+fy(x0,y0)j\nabla f(x_0,y_0)=f_x(x_0,y_0)\bm i+f_y(x_0,y_0)\bm j

在三维情形下,梯度的计算公式可以写成如下形式:

f(x0,y0,z0)=fx(x0,y0,z0)i+fy(x0,y0,z0)j+fz(x0,y0,z0)k\nabla f(x_0,y_0,z_0)=f_x(x_0,y_0,z_0)\bm i+f_y(x_0,y_0,z_0)\bm j+f_z(x_0,y_0,z_0)\bm k

梯度的性质:

梯度和导数有着类似的性质(本质就是另一种形式的导数):

  1. (c1u+c2v)=c1u+c2v\nabla(c_1u+c_2v)=c_1\nabla u+c_2\nabla vc1,c2c_1,c_2 为常数;
  2. (uv)=vu+uv\nabla(uv)=v\nabla u+u\nabla v
  3. (uv)=vuuvv2\nabla(\dfrac u v)=\dfrac{v\nabla u-u\nabla v}{v^2}v0v\neq 0
  4. f(u)=f(u)u\nabla f(u)=f'(u)\nabla uff 为可微函数。

梯度与方向导数的关系:

由于

(f(x))el=f(x)elcosθ=f(x)cosθ(\nabla f(\bm x))\cdot\bm e_l=|\nabla f(\bm x)|\cdot|\bm e_l|\cdot\cos\theta=|\nabla f(\bm x)|\cos\theta

其中 θ\theta 是梯度 f\nabla f 与向量 l\bm l 的夹角。

可以看出,当 l\bm l 与梯度方向一致时,有

flx=f(x)\frac{\partial f}{\partial l}\bigg|_{\bm x}=|\nabla f(\bm x)|

l\bm l 与梯度方向相反时,有

flx=f(x)\frac{\partial f}{\partial l}\bigg|_{\bm x}=-|\nabla f(\bm x)|

即函数 ff 在点 x\bm x 处沿梯度 f\nabla f 方向的方向导数最大,最大值为 f(x)|\nabla f(\bm x)|;而沿梯度 f\nabla f 相反方向的方向导数最小,最小值为 f(x)-|\nabla f(\bm x)|.

多元微分学的几何应用

曲线的切线和法平面

Γ\varGamma 是空间内一条曲线,M0M_0Γ\varGamma 上一定点,MMΓ\varGamma 上任意一点,过 M0,MM_0,M 两点的直线 M0MM_0M 称作 Γ\varGamma割线(secant)。如果当点 MM 沿曲线 Γ\varGamma 趋于点 M0M_0 时,割线 M0MM_0M 存在极限位置 M0TM_0T,则称直线 M0TM_0T 为曲线 Γ\varGamma 在点 M0M_0 处的切线(tangent)

过点 M0M_0 且与切线 M0TM_0T 垂直的平面 π\pi 称为曲线 Γ\varGamma 在点 M0M_0法平面(normal plane)

参数方程作曲线方程:

设空间曲线 Γ\varGamma 用参数方程表示为

{x=x(t)y=y(t)z=z(t)\begin{cases} x=x(t)\\ y=y(t)\\ z=z(t) \end{cases}

M0(x0,y0,z0)ΓM_0(x_0,y_0,z_0)\in\varGamma 对应于参数 t=t0t=t_0,函数 x(t),y(t),z(t)x(t),y(t),z(t)t0t_0 处的导数均存在,并且不全为零。

设动点 M(x,y,z)ΓM(x,y,z)\in\varGamma 对应于参数 t=t0+Δt (Δt0)t=t_0+\Delta t\ (\Delta t\neq 0),则割线 M0MM_0M 的方向向量为

(xx0,yy0,zz0)=(Δx,Δy,Δz)(x-x_0,y-y_0,z-z_0)=(\Delta x,\Delta y,\Delta z)

将上式乘以 1Δt\dfrac 1 {\Delta t},可得

(ΔxΔt,ΔyΔt,ΔzΔt)\left(\frac{\Delta x}{\Delta t},\frac{\Delta y}{\Delta t},\frac{\Delta z}{\Delta t}\right)

Δt0\Delta t\to 0,即 MM0M\to M_0,割线 M0MM_0M 的方向向量的极限即为切线 M0TM_0T 的方向向量,记作切向量 s\bm s,并且

s=(x(t0),y(t0),z(t0))\bm s=(x'(t_0),y'(t_0),z'(t_0))

则曲线 Γ\varGamma 在点 M0M_0 的切线 M0TM_0T 的方程为:

xx0x(t0)=yy0y(t0)=zz0z(t0)\frac{x-x_0}{x'(t_0)}=\frac{y-y_0}{y'(t_0)}=\frac{z-z_0}{z'(t_0)}

法平面 π\pi 的方程为:

x(t0)(xx0)+y(t0)(yy0)+z(z0)(zz0)=0x'(t_0)(x-x_0)+y'(t_0)(y-y_0)+z'(z_0)(z-z_0)=0

一般方程作曲线方程:

设空间曲线 Γ\varGamma 用一般方程表示为

{F(x,y,z)=0G(x,y,z)=0\begin{cases} F(x,y,z)=0\\ G(x,y,z)=0 \end{cases}

M0(x0,y0,z0)ΓM_0(x_0,y_0,z_0)\in\varGamma,函数 F(x,y,z),G(x,y,z)F(x,y,z),G(x,y,z)M0M_0 的某领域内具有连续偏导数,并且对应的雅可比行列式

m=(F,G)(y,z)M0,n=(F,G)(z,x)M0,p=(F,G)(x,y)M0m=\frac{\partial(F,G)}{\partial(y,z)}\bigg|_{M_0},n=\frac{\partial(F,G)}{\partial(z,x)}\bigg|_{M_0},p=\frac{\partial(F,G)}{\partial(x,y)}\bigg|_{M_0}

不全为零。

则曲线 Γ\varGamma 在点 M0M_0 处的切向量为

s=(m,n,p)\bm s=(m,n,p)

或用行列式记为

s=ijkFxFyFzGxGyGzM0\bm s=\begin{vmatrix} \bm i&\bm j&\bm k\\ F_x'&F_y'&F_z'\\ G_x'&G_y'&G_z' \end{vmatrix}_{M_0}

曲线 Γ\varGamma 在点 M0M_0 处的切线方程为:

xx0m=yy0n=zz0p\frac{x-x_0}{m}=\frac{y-y_0}{n}=\frac{z-z_0}{p}

法平面方程为:

m(xx0)+n(yy0)+p(zz0)=0m(x-x_0)+n(y-y_0)+p(z-z_0)=0

曲面的切平面与法线

Σ\varSigma 是空间内一曲面,Γ\varGammaΣ\varSigma 上经过点 M0M_0 的任意一条曲线,所有这些曲线在点 M0M_0 处的切线都与同一向量 n\bm n 垂直,因此这些切线共面,而这个平面就称为曲面 Σ\varSigma 在点 M0M_0 处的切平面(tangent plane)

过点 M0M_0 且垂直于切平面的直线称为曲面 Σ\varSigma 在点 M0M_0 处的法线(normal)n\bm n 为切平面的法向量,也称为曲面 Σ\varSigma 在点 M0M_0 处的法向量

隐函数作曲面方程:

设曲面 Σ\varSigma 的方程为

F(x,y,z)=0F(x,y,z)=0

M0(x0,y0,z0)ΣM_0(x_0,y_0,z_0)\in\varSigma,函数 F(x,y,z)F(x,y,z) 在点 M0M_0 的某领域内具有连续偏导数,并且 Fx(M0),Fy(M0),Fz(M0)F_x(M_0),F_y(M_0),F_z(M_0) 不全为零。

在曲面 Σ\varSigma 上过点 M0M_0 任作一条曲线 Γ\varGamma,设 Γ\varGamma 用参数方程表示为

{x=x(t)y=y(t)z=z(t)\begin{cases} x=x(t)\\ y=y(t)\\ z=z(t) \end{cases}

M0(x0,y0,z0)M_0(x_0,y_0,z_0) 对应于参数 t=t0t=t_0,函数 x(t),y(t),z(t)x(t),y(t),z(t)t0t_0 处的导数均存在,并且不全为零。

由于曲线 Γ\varGamma 在曲面 Σ\varSigma 上,所以有 F[x(t),y(t),z(t)]=0F[x(t),y(t),z(t)]=0,对等式两端关于 tt 求导,并令 t=t0t=t_0,可得

Fx(M0)x(t0)+Fy(M0)y(t0)+Fz(M0)z(t0)=0F_x(M_0)x'(t_0)+F_y(M_0)y'(t_0)+F_z(M_0)z'(t_0)=0

因此,曲面 Σ\varSigma 在点 M0M_0 处的法向量 n\bm n 就是函数 F(x,y,z)F(x,y,z) 在点 M0M_0 处的梯度:

n=f(M0)=(Fx(M0),Fy(M0),Fz(M0))\bm n=\nabla f(M_0)=(F_x(M_0),F_y(M_0),F_z(M_0))

法线方程为:

xx0Fx(M0)=xx0Fy(M0)=xx0Fz(M0)\frac{x-x_0}{F_x(M_0)}=\frac{x-x_0}{F_y(M_0)}=\frac{x-x_0}{F_z(M_0)}

切平面方程为:

Fx(M0)(xx0)+Fy(M0)(yy0)+Fz(M0)(zz0)=0F_x(M_0)(x-x_0)+F_y(M_0)(y-y_0)+F_z(M_0)(z-z_0)=0

二元函数作曲面方程:

设曲面 Σ\varSigma 的方程为

z=f(x,y)z=f(x,y)

M0(x0,y0,z0)ΣM_0(x_0,y_0,z_0)\in\varSigma,其中 z0=f(x0,y0)z_0=f(x_0,y_0),函数 f(x,y)f(x,y) 在点 (x0,y0)(x_0,y_0) 的某邻域内具有连续偏导数。

则曲面 Σ\varSigma 在点 M0M_0 处的法向量为:

n=(fx(x0,y0),fy(x0,y0),1)\bm n=(f_x(x_0,y_0),f_y(x_0,y_0),-1)

法线方程为:

xx0fx(x0,y0)=yy0fy(x0,y0)=zz01\frac{x-x_0}{f_x(x_0,y_0)}=\frac{y-y_0}{f_y(x_0,y_0)}=\frac{z-z_0}{-1}

切平面方程为:

zz0=fx(x0,y0)(xx0)+fy(x0,y0)(yy0)z-z_0=f_x(x_0,y_0)(x-x_0)+f_y(x_0,y_0)(y-y_0)

参数方程作曲面方程:

设曲面 Σ\varSigma 的方程为

{x=x(u,v)y=y(u,v)z=z(u,v)\begin{cases} x=x(u,v)\\ y=y(u,v)\\ z=z(u,v) \end{cases}

M0(x0,y0,z0)ΣM_0(x_0,y_0,z_0)\in\varSigma 对应于参数 u=u0,v=v0u=u_0,v=v_0,函数 x(u,v),y(u,v),z(u,v)x(u,v),y(u,v),z(u,v)P0(u0,v0)P_0(u_0,v_0) 的某邻域内具有连续偏导数,并且

ijkxuyuzuxvyvzvP0=((y,z)(u,v),(z,x)(u,v),(x,y)(u,v))P00\begin{vmatrix} \bm i&\bm j&\bm k\\ x_u&y_u&z_u\\ x_v&y_v&z_v \end{vmatrix}_{P_0}=\left(\frac{\partial(y,z)}{\partial(u,v)},\frac{\partial(z,x)}{\partial(u,v)},\frac{\partial(x,y)}{\partial(u,v)}\right)\bigg|_{P_0}\neq\bm 0

A=(y,z)(u,v)P0,B=(z,x)(u,v)P0,C=(x,y)(u,v)P0A=\frac{\partial(y,z)}{\partial(u,v)}\bigg|_{P_0},B=\frac{\partial(z,x)}{\partial(u,v)}\bigg|_{P_0},C=\frac{\partial(x,y)}{\partial(u,v)}\bigg|_{P_0}

则曲面 Σ\varSigma 在点 M0M_0 处的法向量为:

n=(A,B,C)\bm n=(A,B,C)

法线方程为:

xx0A=yy0B=zz0C\frac{x-x_0}{A}=\frac{y-y_0}{B}=\frac{z-z_0}{C}

切平面方程为:

A(xx0)+B(yy0)+C(zz0)=0A(x-x_0)+B(y-y_0)+C(z-z_0)=0

多元函数泰勒公式

在多元函数中存在着和一元函数类似的泰勒展开公式,模仿一元函数的形式,我们有如下定理:

定理: 设二元函数 f(x,y)f(x,y) 在点 (x0,y0)(x_0,y_0) 的某领域内具有 n+1n+1 阶连续偏导数,(x0+Δx,y0+Δy)U(x0,y0)(x_0+\Delta x,y_0+\Delta y)\in U(x_0,y_0),则 ff 在点 (x0,y0)(x_0,y_0) 处存在 n\bm n 阶泰勒公式

f(x0+Δx,y0+Δy)=f(x0,y0)+k=1n1k!(Δxx+Δyy)kf(x0,y0)+Rn\begin{aligned} &\quad f(x_0+\Delta x,y_0+\Delta y)\\ &=f(x_0,y_0)+\sum_{k=1}^n\frac 1 {k!}\left(\Delta x\frac{\partial}{\partial x}+\Delta y\frac{\partial}{\partial y}\right)^kf(x_0,y_0)+R_n \end{aligned}

规定

(Δxx+Δyy)kf=i=0kCkiΔxkiΔyikfxkiyi(k=1,2,,n+1)\left(\Delta x\frac{\partial}{\partial x}+\Delta y\frac{\partial}{\partial y}\right)^kf=\sum_{i=0}^kC_k^i\Delta x^{k-i}\Delta y^i\frac{\partial^kf}{\partial x^{k-i}\partial y^i}\quad(k=1,2,\cdots,n+1)

其中 RnR_n拉格朗日型余项,令 θ(0,1)\theta\in(0,1),其完整形式如下:

Rn=1(n+1)!(Δxx+Δyy)n+1f(x0+θΔx,y0+θΔy)R_n=\frac{1}{(n+1)!}\left(\Delta x\frac{\partial}{\partial x}+\Delta y\frac{\partial}{\partial y}\right)^{n+1}f(x_0+\theta\Delta x,y_0+\theta\Delta y)

下面给出了带有拉格朗日型余项的二阶泰勒公式:

f(x,y)=f(x0,y0)+[fx(x0,y0)Δxfy(x0,y0)Δy]+12[fxx(x0,y0)(Δx)2+2fxy(x0,y0)ΔxΔy+fyy(x0,y0)(Δy)2]+Rn\begin{aligned} f(x,y)&=f(x_0,y_0)+[f_x(x_0,y_0)\Delta xf_y(x_0,y_0)\Delta y]\\ &+\frac 1 2\left[f_{xx}(x_0,y_0)(\Delta x)^2+2f_{xy}(x_0,y_0)\Delta x\Delta y+f_{yy}(x_0,y_0)(\Delta y)^2\right]\\ &+R_n \end{aligned}

Rn=13![fxxx(x0+θΔx,y0+θΔy)(Δx)3+3fxxy(x0+θΔx,y0+θΔy)(Δx)2(Δy)+3fxyy(x0+θΔx,y0+θΔy)(Δx)(Δy)2+fyyy(x0+θΔx,y0+θΔy)(Δy)3]\begin{aligned} R_n=\frac 1 {3!}\big[&f_{xxx}(x_0+\theta\Delta x,y_0+\theta\Delta y)(\Delta x)^3\\ &+3f_{xxy}(x_0+\theta\Delta x,y_0+\theta\Delta y)(\Delta x)^2(\Delta y)\\ &+3f_{xyy}(x_0+\theta\Delta x,y_0+\theta\Delta y)(\Delta x)(\Delta y)^2\\ &+f_{yyy}(x_0+\theta\Delta x,y_0+\theta\Delta y)(\Delta y)^3\big] \end{aligned}

皮亚诺型余项: 设二元函数 f(x,y)f(x,y) 在点 (x0,y0)(x_0,y_0) 的某领域内具有 nn 阶连续偏导数,则当 ρ=Δx2+Δy20\rho=\sqrt{\Delta x^2+\Delta y^2}\to 0 时,ff 在点 (x0,y0)(x_0,y_0) 处存在 nn 阶泰勒公式:

f(x0+Δx,y0+Δy)=f(x0,y0)+k=1n1k!(Δxx+Δyy)kf(x0,y0)+o(ρn)\begin{aligned} &\quad f(x_0+\Delta x,y_0+\Delta y)\\ &=f(x_0,y_0)+\sum_{k=1}^n\frac 1 {k!}\left(\Delta x\frac{\partial}{\partial x}+\Delta y\frac{\partial}{\partial y}\right)^kf(x_0,y_0)+o(\rho^n) \end{aligned}

(x0,y0)=(0,0)(x_0,y_0)=(0,0) 时,nn 阶泰勒公式可以转化为 n\bm n 阶麦克劳林公式

黑塞矩阵

nn 元函数 f(x)f(\bm x) 具有二阶连续偏导数,其中 x=(x1,x2,,xn)\bm x=(x_1,x_2,\cdots,x_n),则由 ff 的二阶偏导数组成的方阵:

H(x)=[2fx122fx1x22fx1xn2fx2x12fx222fx2xn2fxnx12fxnx22fxn2]\bm H(\bm x)=\begin{bmatrix} \dfrac{\partial^2f}{\partial x_1^2}&\dfrac{\partial^2f}{\partial x_1\partial x_2}&\cdots&\dfrac{\partial^2f}{\partial x_1\partial x_n}\\ \dfrac{\partial^2f}{\partial x_2\partial x_1}&\dfrac{\partial^2f}{\partial x_2^2}&\cdots&\dfrac{\partial^2f}{\partial x_2\partial x_n}\\ \vdots&\vdots&\ddots&\vdots\\ \dfrac{\partial^2f}{\partial x_n\partial x_1}&\dfrac{\partial^2f}{\partial x_n\partial x_2}&\cdots&\dfrac{\partial^2f}{\partial x_n^2} \end{bmatrix}

这个方阵被称作黑塞矩阵(Hessian matrix),它的每一个元素为

Hij=2fxixj\bm H_{ij}=\frac{\partial^2f}{\partial x_i\partial x_j}

ff 为二元函数,则 x0=(x0,y0)\bm x_0=(x_0,y_0)Δx=(Δx,Δy)\Delta\bm x=(\Delta x,\Delta y),此时对应的黑塞矩阵为

H(x0,y0)=[2f(x0,y0)x22f(x0,y0)xy2f(x0,y0)yx2f(x0,y0)y2]\bm H(x_0,y_0)=\begin{bmatrix} \dfrac{\partial^2f(x_0,y_0)}{\partial x^2}&\dfrac{\partial^2f(x_0,y_0)}{\partial x\partial y}\\ \dfrac{\partial^2f(x_0,y_0)}{\partial y\partial x}&\dfrac{\partial^2f(x_0,y_0)}{\partial y^2} \end{bmatrix}

可以看出,f(x)f(\bm x) 的二阶泰勒展开式可以用梯度和黑塞矩阵改写为

f(x0+Δx)=f(x0)+f(x0)Δx+12ΔxH(x0)ΔxT+o(ρ2)f(\bm x_0+\Delta\bm x)=f(\bm x_0)+\nabla f(\bm x_0)\cdot\Delta\bm x+\frac 1 2 \Delta\bm x\bm H(\bm x_0)\Delta\bm x^T+o(\rho^2)

多元函数的极值问题

极值与最值

极值的定义:nn 元函数 f(x)f(\bm x) 在点 x0\bm x_0 的某邻域 U(x0)U(\bm x_0) 内有定义,若 xU˚(x0)\forall\bm x\in\mathring U(x_0),恒有

f(x)<f(x0)(f(x)>f(x0))f(\bm x)<f(\bm x_0)\quad(f(\bm x)>f(\bm x_0))

则称 f(x)f(\bm x) 在点 x0\bm x_0 处取得极大值(极小值),点 x0\bm x_0 称为 f(x)f(\bm x)极大值点(极小值点)

函数取极值的必要条件:nn 元函数 f(x)f(\bm x) 在点 x0\bm x_0 处可偏导,则当函数在该点取得极值时,有

f(x0)xi=0(i=1,2,,n)\frac{\partial f(\bm x_0)}{\partial x_i}=0\quad(i=1,2,\cdots,n)

f(x0)=0\nabla f(\bm x_0)=\bm 0

称满足 f(x0)=0\nabla f(\bm x_0)=\bm 0 的点 x0\bm x_0 为函数 f(x)f(\bm x)驻点

函数取极值的充分条件:nn 元函数 f(x)f(\bm x) 在点 x0\bm x_0 的某邻域 U(x0)U(\bm x_0) 内具有二阶偏导数,x0\bm x_0f(x)f(\bm x) 的驻点,H(x0)\bm H(\bm x_0)f(x)f(\bm x) 在点 x0\bm x_0 处的黑塞矩阵,则

  1. H(x0)\bm H(\bm x_0) 为正定矩阵,则 ff 在点 x0\bm x_0 处取得极小值;
  2. H(x0)\bm H(\bm x_0) 为负定矩阵,则 ff 在点 x0\bm x_0 处取得极大值;
  3. H(x0)\bm H(\bm x_0) 为不定矩阵,则 ff 在点 x0\bm x_0 处无极值;
  4. H(x0)\bm H(\bm x_0) 为半正定或半负定矩阵,则 ff 在点 x0\bm x_0 处是否有极值无法确定。

有关正定二次型与正定矩阵相关内容,见 矩阵代数(三):特征值与二次型

推论: 设二元函数 f(x,y)f(x,y) 在点 (x0,y0)(x_0,y_0) 的某邻域 U(x0,y0)U(x_0,y_0) 内具有二阶偏导数,(x0,y0)(x_0,y_0)f(x,y)f(x,y) 的驻点,记

A=fxx(x0,y0),B=fxy(x0,y0),C=fyy(x0,y0)A=f_{xx}(x_0,y_0),\quad B=f_{xy}(x_0,y_0),\quad C=f_{yy}(x_0,y_0)

  1. ACB2>0AC-B^2>0,且 A>0A>0,则 ff 在点 (x0,y0)(x_0,y_0) 处取得极小值;
  2. ACB2>0AC-B^2>0,且 A<0A<0,则 ff 在点 (x0,y0)(x_0,y_0) 处取得极大值;
  3. ACB2<0AC-B^2<0,则 ff 在点 (x0,y0)(x_0,y_0) 处无极值;
  4. ACB2=0AC-B^2=0,则 ff 在点 (x0,y0)(x_0,y_0) 处是否有极值无法确定。

最值的求解方法:

Ω\varOmegaRn\bm R^n 中的有界闭区域,nn 元函数 f(x)f(\bm x)Ω\varOmega 上具连续偏导数,则 f(x)f(\bm x)Ω\varOmega 上必有最大值和最小值,它们在 Ω\varOmega 的内部或边界 Ω\partial\varOmega 上取到,如果 f(x)f(\bm x)Ω\varOmega 内的点 x0\bm x_0 处取得最值,则 x0\bm x_0 必是 f(x)f(\bm x) 的极值点。

因此,我们可以用以下方法求 f(x)f(\bm x)Ω\varOmega 上的最值:

  1. 先求出 f(x)f(\bm x)Ω\varOmega 内的可能极值点的函数值;
  2. 再求出 f(x)f(\bm x)Ω\partial\varOmega 上的最值;
  3. 将这些函数值进行比较,其中最大的就是 f(x)f(\bm x)Ω\varOmega 上的最大值,最小的就是 f(x)f(\bm x)Ω\varOmega 上的最小值。

例:设 DD 是由 xx 轴,yy 轴以及直线 x+y=6x+y=6 围成的三角形区域,求函数 z=f(x,y)=x2y(4xy)z=f(x,y)=x^2y(4-x-y)DD 上的最大值与最小值。

解:

fx(x,y)=2xy(4xy)x2yfy(x,y)=x2(4xy)x2y\begin{aligned} f_x(x,y)&=2xy(4-x-y)-x^2y\\ f_y(x,y)&=x^2(4-x-y)-x^2y \end{aligned}

fx(x,y)=0,fy(x,y)=0f_x(x,y)=0,f_y(x,y)=0,可得 ffDD 内唯一的驻点 (2,1)(2,1)f(2,1)=4f(2,1)=4.

xx 轴上:y=0y=0f(x,y)=0f(x,y)=0
yy 轴上:x=0x=0f(x,y)=0f(x,y)=0.

在直线 x+y=6x+y=6 上:y=6xy=6-x,可得

z=φ(x)=f(x,6x)=2x312x2,x[0,6]z=\varphi(x)=f(x,6-x)=2x^3-12x^2,\quad x\in[0,6]

按照一元函数的方法,求导得

dzdx=6x224x\frac{\mathrm{d}z}{\mathrm{d}x}=6x^2-24x

z=0z'=0,得 φ(x)\varphi(x)(0,6)(0,6) 内唯一驻点 x=4x=4,所以 φ(x)\varphi(x)[0,6][0,6] 上最大值为 0,最小值为 φ(4)=64\varphi(4)=-64.

综上所述,最小值为 f(4,2)=64f(4,2)=-64.

条件极值(拉格朗日乘数法)

我们将目标函数 f(x)f(\bm x) 在定义域内满足某种条件时取到的极值称为条件极值(conditional extremum),该条件通常以方程的形式表述,称为约束方程,记作 φ(x)=0\varphi(\bm x)=0

定理:x,x0Rn\bm x,\bm x_0\in R^nnn 元函数 f(x),φ(x)f(\bm x),\varphi(\bm x)U(x0)U(\bm x_0) 上有一阶连续偏导数,且 φ(x0)0\nabla\varphi(\bm x_0)\neq 0,若 x0\bm x_0 是目标函数 f(x)f(\bm x) 在约束条件 φ(x)=0\varphi(\bm x)=0 下的极值点,则存在常数 λ\lambda,使得 f(x0)+λφ(x0)=0\nabla f(\bm x_0)+\lambda\nabla\varphi(\bm x_0)=\bm 0.

x=(x,y,z),x0=(x0,y0,z0)\bm x=(x,y,z),\bm x_0=(x_0,y_0,z_0),则

{fx(x0)+λφx(x0)=0fy(x0)+λφy(x0)=0fz(x0)+λφz(x0)=0\begin{cases} f_x(\bm x_0)+\lambda\varphi_x(\bm x_0)=0\\ f_y(\bm x_0)+\lambda\varphi_y(\bm x_0)=0\\ f_z(\bm x_0)+\lambda\varphi_z(\bm x_0)=0 \end{cases}

证明:

记由方程 φ(x)=0\varphi(\bm x)=0 所确定的曲面为 Σ\varSigma,则点 x0Σ\bm x_0\in\varSigma,设 Γ:{x=x(t)y=y(t)z=z(t)\varGamma:\begin{cases}x=x(t)\\y=y(t)\\z=z(t)\end{cases}Σ\varSigma 上过点 x0\bm x_0 的任意一条光滑曲线,且点 x0\bm x_0 对应的参数 t=t0t=t_0,则按假设 f[x(t),y(t),z(t)]f[x(t),y(t),z(t)] 必在 t0t_0 处取极值,从而

ddtf[x(t),y(t),z(t)]t=t0=0\frac{\mathrm{d}}{\mathrm{d}t}f[x(t),y(t),z(t)]\bigg|_{t=t_0}=0

fx(x0)x(t0)+fy(x0)y(t0)+fz(x0)z(t0)=0f_x(\bm x_0)x'(t_0)+f_y(\bm x_0)y'(t_0)+f_z(\bm x_0)z'(t_0)=0

s=(x(t0),y(t0),z(t0))\bm s=(x'(t_0),y'(t_0),z'(t_0)),它是曲线 Γ\varGamma 上在点 x0\bm x_0 处的切向量,于是

f(x0)s=0\nabla f(\bm x_0)\cdot\bm s=0

由此可知向量 f(x0)\nabla f(\bm x_0) 垂直于曲面 Σ\varSigma 在点 x0\bm x_0 处的切平面。又因为 φ(x0)0\nabla\varphi(\bm x_0)\neq 0,可得

n=φ(x0)=(φx(x0),φy(x0),φz(x0))\bm n=\nabla\varphi(\bm x_0)=(\varphi_x(\bm x_0),\varphi_y(\bm x_0),\varphi_z(\bm x_0))

为曲面 Γ\varGamma 在点 x0\bm x_0 处得切平面的法向量,所以 f(x0)\nabla f(\bm x_0)φ(x0)\nabla\varphi(\bm x_0) 平行,即存在常数 λ\lambda,使得

f(x0)=λφ(x0)\nabla f(\bm x_0)=-\lambda\nabla\varphi(\bm x_0)

f(x0)+λφ(x0)=0\nabla f(\bm x_0)+\lambda\nabla\varphi(\bm x_0)=\bm 0

应用: 引入辅助函数

L(x,λ)=f(x)+λφ(x)L(\bm x,\lambda)=f(\bm x)+\lambda\varphi(\bm x)

称该辅助函数为拉格朗日函数,参数 λ\lambda拉格朗日乘数

x0\bm x_0 是方程组

{L=f(x0)+λφ(x0)=0Lλ=φ(x)=0\begin{cases} \nabla L=\nabla f(\bm x_0)+\lambda\nabla\varphi(\bm x_0)=\bm 0\\ L_\lambda=\varphi(\bm x)=0 \end{cases}

的解,那么 x0\bm x_0 是目标函数 f(x)f(\bm x) 在约束条件 φ(x)=0\varphi(\bm x)=0 下的可能极值点。

例:求函数 f(x,y)=x2y2+2f(x,y)=x^2-y^2+2 在椭圆域 D={(x,y)x2+y241}D=\{(x,y)\mid x^2+\dfrac{y^2}{4}\leq 1\} 上的最大值和最小值。

解:先求 DD 内部的驻点:

fx=2x,fy=2yf_x=2x,\quad f_y=-2y

{fx=2x=0fy=2y=0\begin{cases}f_x=2x=0\\f_y=-2y=0\end{cases}

解得 x=0,y=0x=0,y=0.

再求 DD 边界上的驻点:所设拉格朗日函数为

F(x,y,λ)=x2y2+λ(x2+y241)F(x,y,\lambda)=x^2-y^2+\lambda\left(x^2+\frac{y^2}{4}-1\right)

则令

{Fx=2x+2λx=0Fy=2y+λ2y=0Fλ=x2+y241=0\begin{cases} F_x=2x+2\lambda x=0\\ F_y=-2y+\dfrac\lambda 2 y=0\\ F_\lambda=x^2+\dfrac{y^2}{4}-1=0 \end{cases}

解得 (±1,0),(0,±2)(\pm 1,0),(0,\pm 2),又因为

f(±1,0)=3,f(0,±2)=2,f(0,0)=2f(\pm 1,0)=3,\quad f(0,\pm 2)=-2,\quad f(0,0)=2

所以最大值为 3,最小值为 -2.