平面点集
在平面上确立了直角坐标系之后,所有有序实数对 (x,y) 与平面上所有点之间建立起了一一对应关系,坐标平面上满足某种条件 P 的点的集合,称为平面点集(planar point set),记作
E={(x,y)∣(x,y) 满足条件 P}
将平面上两点 P1(x1,y1) 和 P2(x2,y2) 之间的距离记为 ρ(P1,P2)。在Euclid空间中,两点间距离可以表示为:
ρ(P1,P2)=(x1−x2)2+(y1−y2)2
常见平面点集:
(1)全平面:R2={(x,y)∣−∞<x<+∞,−∞<y<+∞}
(2)圆:C={(x,y)∣x2+y2<r2}
(3)矩形:S={(x,y)∣a≤x≤b,c≤y≤d}
也常记作:S=[a,b]×[c,d]
(4)点 A(x0,y0) 的 δ 邻域,即 U(A,δ):
- 圆形邻域:{(x,y)∣(x−x0)2+(y−y0)2<δ2}
- 方形邻域:{(x,y)∣∣x−x0∣<δ,∣y−y0∣<δ}
(5)点 A(x0,y0) 的 δ 去心邻域,即 U˚(a,δ):
- 圆形邻域:{(x,y)∣0<(x−x0)2+(y−y0)2<δ2}
- 方形邻域:{(x,y)∣∣x−x0∣<δ,∣y−y0∣<δ,(x,y)=(x0,y0)}
点与点集的关系
任意一点 A∈R2 与任意一个点集 E⊂R2 之间必有以下三种关系之一:
-
内点: 若 ∃δ>0,使得 U(A,δ)⊆E,则称点 A 为 E 的内点(interior point),由 E 的全体内点所构成的集合称为 E 的内部,记作 intE。
-
外点: 若 ∃δ>0,使得 U(A,δ)∩E=∅,则称点 A 为 E 的外点(exterior point),由 E 的全体外点所构成的集合称为 E 的外部。
-
界点: 若 ∀δ,恒有 U(A,δ)∩E=∅ 并且 U(A,δ)∩E=∅,则称点 A 为 E 的界点(boundary point),由 E 的全体界点所构成的集合称为 E 的边界,记作 ∂E。
E 的内点必定属于 E,E 的外点必定不属于 E,E 的界点可能属于 E 也可能不属于 E。
只有当 ∂E⊂E 时,E 才可以被称为是 E 的外部。
按照点 A 的近旁是否密集着 E 中的无穷多个点,点与点集还可以构成另一类关系:
- 聚点: 若在点 A 的任何去心邻域 U˚(A) 内都含有 E 中的点,则称点 A 为 E 的聚点(accumulation point)。
聚点本身可以不属于 E。
- 孤立点: 若 ∃δ>0,使得 U˚(A,δ)∩E=∅,则称点 A 为 E 的孤立(isolated point)。
若 A∈E,并且 A 不是 E 的聚点,则 A 为 E 的孤立点。
两种点与点集关系的联系:
- 孤立点必为界点。
- 内点和非孤立点的界点必为聚点。
- 既非聚点,又非孤立点,则必为外点。
重要平面点集定义
1. 开集:
若 E 所属的每一点都是 E 的内点(即 E=intE),则称 E 为开集(open set)。
2. 闭集:
若 E 的所有聚点都属于 E(即 E=E)或 E 没有聚点,则称 E 为闭集(closed set)。
在平面点集中,只有 R2 和 ∅ 是既开又闭的。
3. 开域:
非空连通开集即为开域(open region)。
所谓连通性(connectivity),即 E 中任意两点之间都可以用一条完全含于 E 的有限折线相连接。
4. 闭域:
开域连同其边界所成的集合称为闭域(closed region)。开域和闭域统称为区域。
闭域必为闭集,而闭集不一定为闭域。
5. 凸区域:
若一个区域中任意两点 P1(x1,y1),P2(x2,y2),都满足 P(x1+λ(x2−x1),y1+λ(y2−y1))(λ 为任意常数)也在该区域中,则该区域为凸区域。
6. 有界/无界点集:
对于平面点集 E,若 ∃r>0,使得
E⊂U(O,r)
其中 O 是一固定点,称 E 为有界点集(bounded point set),r 为点集的半径。
点集的有界性可以用点集的直径来反映,所谓点集的直径,即
d(E)=P1,P2∈Esupρ(P1,P2)
其中 ρ(P1,P2) 为 P1 和 P2 之间的距离。
当 d(E) 为有限值时,E 为有界点集,否则为无界点集。
全平面上的完备性定理
点列的收敛性:
设 {Pn}⊂R2 为一列点,P0 为一固定点,若 ∀ε>0,∃N∈N+,使得当 n>N 时,Pn∈U(P0,ε),则称点列 {Pn} 收敛于点 P0,记作:
Pn→P0 (n→∞)n→∞limPn=P0
当 Pn 与 P0 分别为 (xn,yn) 与 (x0,y0) 时,显然有
n→∞limxn=x0 且 n→∞limyn=y0
若记 ρn=ρ(Pn,P0),则有
n→∞limρn=0
柯西收敛准则:
{Pn}⊂R2 收敛的充要条件是:∀ε>0,∃N∈N+,使得当 n>N 时,都满足
ρ(Pn,Pn+p)<ε,∀p∈N+
闭域套定理:
设 {Dn} 是 R2 中的一列闭域,它满足:
- Dn+1⊂Dn, n=1,2,⋯
- dn=d(Dn), n→∞limdn=0
则存在唯一的点:
P0∈Dn, n=1,2,⋯
推论: 对上述闭域套(或闭集套){Dn},∀ε>0,∃N∈N+,当 n>N 时,Dn⊂U(P0,ε).
聚点定理:
若 E⊂R2 为有界无限点集,则 E 在 R2 中至少有一个聚点。
有限覆盖定理:
若 E⊂R2 为一有界闭域(或有界闭集),{Δα} 为一集族开域(或开集),它覆盖了 D,则在 {Δα} 中必存在有限个开域 Δ1,Δ2,⋯,Δn,它们同样覆盖了 D,即
D⊂i=1⋃nΔi
多元函数
多元函数的定义:
设 D 为 Rn 的非空子集,将从 D 到实数集 R 的映射 f→R 称为定义在 D 上的 n 元函数,记作:
f:x=(x1,x2,⋯,xn),u=f(x),x∈D
或
u=f(x)=f(x1,x2,⋯,xn),x∈D
其中 x1,x2,⋯,xn 称为自变量,u 称为因变量,D 称为函数 f 的定义域,集合
f(D)={f(x)∣x∈D}
称为函数 f 的值域。若值域是有界数集,则称函数 f 在 D 上为有界函数,否则为无界函数。
我们在这里研究的一般是二元函数,可以记作:
z=f(x,y),(x,y)∈D
或点函数形式:
z=f(P),P∈D
二元函数的图像:
对于任意一个点 P(x,y)∈D,有一个确定的函数值 z=f(x,y),以这个 z 为竖坐标,这样就可以作出空间 Oxyz 中一点 M(x,y,f(x,y)).
称三维空间中的点集:
W={(x,y,z)∣z=f(x,y),(x,y)∈D}
为二元函数 z=f(x,y), (x,y)∈D 的图像。
二重极限
二重极限的定义:
f 是定义在 D⊂R2 上的二元函数,P0 是 D 中的一个聚点,A 为常数,若 ∀ε>0,∃δ>0,当 P∈U˚(P0,δ)∩D 时,满足
∣f(P)−A∣<ε
则称 f 在 D 上当 P→P0 时的极限为 A,记作
P∈DP→P0limf(P)=A
二元函数的极限也被称为二重极限。
推论 1: E⊂D,P0 是 E 中的聚点,若 P∈EP→P0limf(P) 不存在,则 P∈DP→P0limf(P) 也不存在。
推论 2: E1,E2⊂D,P0 是它们的聚点,若 P∈E1P→P0limf(P)=A1,P∈E2P→P0limf(P)=A2,并且 A1=A2,则 P∈DP→P0limf(P) 不存在。
推论 3: P∈DP→P0limf(P) 存在的充要条件是,在 D 中存在点列 P1,P2,⋯,Pn (Pn=P0),并且 n→∞limPn=P0,使得数列 {f(Pn)} 收敛。
非正常极限:
f 是定义在 D⊂R2 上的二元函数,P0 是 D 中的一个聚点,若 ∀M>0,∃ε>0,当 P∈U˚(P0,δ)∩D 时,满足
∣f(P)∣>M
此时称 f 在 D 上当 P→P0 时有非正常极限,记作:
P∈DP→P0limf(P)=∞ (+∞ 或 −∞)
f 在 D 上无界⟺∃{Pk}⊂D, 使 k→∞limf(Pk)=∞
极限的四则运算:
设当 P→P0 时,极限 P→P0limf(P),P→P0limg(P) 存在,则
- P→P0lim[f(P)±g(P)]=P→P0limf(P)±P→P0limg(P)
- 对任意常数 c,P→P0limcf(P)=cP→P0limf(P)
- P→P0limf(P)g(P)=P→P0limf(P)⋅P→P0limg(P)
- 当 P→P0limg(P)=0 时,
P→P0limg(P)f(P)=P→P0limg(P)P→P0limf(P)
复合函数的极限:
设
- u=f(P) 是定义在 D 上的二元函数,值域为 f(D),极限 P→P0limf(P)=A;
- z=φ(u) 是定义在 I 上的一元函数,极限 u→Alimφ(u)=B;
- f(D)⊂I,且对于 D 中的点 P0 附近的点 P=P0,f(P)=A,则
P→P0limφ[f(P)]=B
利用定义求二重极限:
例:证明 (x,y)→(0,0)lim(xsiny1+ysinx1)=0.
证:f(x,y)=xsiny1+ysinx1 的定义域为 D={(x,y)∣x=0,y=0},P0(0,0) 是 D 的聚点。因为当 x=0,y=0 时
∣f(x,y)−0∣=∣xsiny1+ysinx1∣≤∣x∣+∣y∣≤2x2+y2
故 ∀ε>0,取 δ=21ε,则当 (x,y)∈D,且 0<x2+y2<δ 时,有
∣f(x,y)−0∣<ε
即 (x,y)→(0,0)lim(xsiny1+ysinx1)=0.
利用一元函数极限求二重极限:
例:求极限 (x,y)→(0,0)lim(x+y)ln(x2+y2).
解:设 0≤x2+y2≤1,则
lnx2≤ln(x2+y2)≤0,lny2≤ln(x2+y2)≤0,
从而
∣lnx2∣≥∣ln(x2+y2)∣,∣lny2∣≥∣ln(x2+y2)∣
于是
0≤∣(x+y)ln(x2+y2)∣≤∣xlnx2∣+∣ylny2∣
而 x→0limxlnx2=0,y→0limylny2=0,
因此 (x,y)→(0,0)lim(x+y)ln(x2+y2)=0.
利用极坐标求二重极限:
令 x=rcosφ, y=rsinφ,则 (x,y)→(0,0) 时,r→0.
例:求极限 (x,y)→(0,0)limxyx2+y2x2−y2.
解:
xyx2+y2x2−y2=rcosφrsinφr2r2cos2φ−r2sin2φ=21r2sin2φcos2φ=41r2sin4φr→0lim41r2sin4φ=0
综上所述,(x,y)→(0,0)limxyx2+y2x2−y2=0.
证明二重极限不存在:
若自变量 x 和 y 在取不同关系时,原式求出的极限值不同,则其二重极限不存在。
例:设 f(x,y)=x4+y2x2y,证明当 (x,y)→(0,0) 时,f(x,y) 的极限不存在。
证:沿着 x 轴和 y 轴趋于 (0,0) 时,有
(x,0)→(0,0)limx4+y2x2y=0,(0,y)→(0,0)limx4+y2x2y=0
沿着直线 y=kx (k=0),也有
(x,kx)→(0,0)limx4+y2x2y=x→0limx4+k2x2kx3=0
但是,沿着抛物线 y=kx2 (k=0),有
(x,kx2)→(0,0)limx4+y2x2y=x→0limx4+k2x4kx4=1+k2k=0
综上所述,当 (x,y)→(0,0) 时,f(x,y) 的极限不存在。
累次极限
设函数 f(x,y),若对任一固定的 y=y0,存在极限 x→x0limf(x,y)=φ(y),且存在极限 y→y0limφ(y)=A,则称 A 为 f(x,y) 在点 (x0,y0) 处先对 x 后对 y 的二次极限,记作:
y→y0limx→x0limf(x,y)=A
定理: 当 f(x,y) 在点 (x0,y0) 处的二重极限及两个二次极限都存在时,它们必相等,即
(x,y)→(x0,y0)limf(x,y)=y→y0limx→x0limf(x,y)=x→x0limy→y0limf(x,y)
二元函数的连续性
f 是定义在 D⊂R2 上的二元函数,P0∈D,若 ∀ε>0,∃δ>0,对于 P∈U(P0,δ)∩D,有 ∣f(P)−f(P0)∣<ε,则函数 f 在点 P0 处连续,此时称 P0 为 f 的连续点,否则称其为间断点。
- 若 P0 为孤立点,则仅存在 P0∈U(P0,δ)∩D,P0 必为连续点。
- 若 P0 为聚点,当 P0 处有定义且存在极限,并且 P→P0limf(P)=f(P) 时,P0 为连续点。
在上述函数中,设 P0(x0,y0),在 x0,y0 分别取得增量 Δx,Δy,且 P(x0+Δx,y0+Δy)∈U(P0),则相应的函数有增量
Δz=f(x0+Δx,y0+Δy)−f(x0,y0)
称 Δz 为函数 z=f(x,y) 在点 P0(x0,y0) 处的全增量(full increment)。用全增量刻画函数在点 P0 处的连续性,可以表示为:
(Δx,Δy)→(0,0)limΔz=(Δx,Δy)→(0,0)limf(x0+Δx,y0+Δy)−f(x0,y0)=0
复合函数的连续性:
设 u=φ(x,y),v=ψ(x,y) 在 x,y 平面上,在 U(P0) 上有定义,且在 P0(x0,y0) 处连续;f(u,v) 在 u,v 平面上,在 U(Q0) 上有定义,且在 Q0(u0,v0) 处连续,其中 u0=φ(x0,y0),v0=ψ(x0,y0),则 g(x,y)=f[φ(x,y),ψ(x,y)] 在 P0 处连续。
多元初等函数的连续性:
任何一个定义在较低维空间的函数,总可以看成是一个定义在较高维空间上的函数:
f(x)f(x,y)f(x,y,z)=1−x2,=1−x2+0⋅y,=1−x2+0⋅z+0⋅y,x(x,y)(x,y,z)∈[−1,1]∈[−1,1]×R∈[−1,1]×R2
可以证明,若一元函数 f(x) 在定义域上连续,则其对应的多元函数也在相应的定义域上连续。
多元初等函数是指由常数及具有不同自变量的一元基本初等函数经过有限次四则运算和复合得到的,并且能用一个算式表达的多元函数。一切多元初等函数在其定义域内都是连续的。
有界闭域上连续二元函数的性质
有界性定理:
若函数 f(x,y) 在有界闭域 D 上连续,则它在 D 上有界。即 ∃M>0,使得 ∀(x,y)∈D,都有 ∣f(x,y)∣≤M.
最值定理:
若函数 f(x,y) 在有界闭域 D 上连续,则它在 D 上必有最大值和最小值。即 ∃(x1,y1),(x2,x2)∈D,使得 ∀(x,y)∈D,都有
f(x1,y1)≤f(x,y)≤f(x2,y2)
介值定理:
若函数 f(x,y) 在有界闭域 D 上连续,则它必取得介于最大值 M 和最小值 m 之间的任何值。即 ∀μ∈[m,M],至少存在一点 (x,y)∈D,使得
f(x,y)=μ
一致连续定理:
若函数 f(x,y) 在有界闭域 D 上连续,则它在 D 上一致连续。即 ∀ε>0,∃δ>0,则 ∀P(x1,y1),Q(x2,y2)∈D,当 ρ(P,Q)<δ 时,有
∣f(x1,y1)−f(x2,y2)∣<ε
偏导数
偏导数的定义
设函数 z=f(x,y) 在点 P0(x0,y0) 的某邻域 U(P0) 内有定义,令 y=y0,自变量 x 自 x0 取得增量 Δx,此时相应的函数增量被称为偏增量(partial increment):
Δxz=f(x0+Δx,y0)−f(x0,y0)
如果极限
Δx→0limΔxΔxz=Δx→0limΔxf(x0+Δx,y0)−f(x0,y0)
存在,则称该极限为函数 z=f(x,y) 在点 P0 处关于自变量 x 的偏导数(partial derivative),记作
∂x∂z(x0,y0) 或 ∂x∂f(x0,y0) 或 zx(x0,y0) 或 fx(x0,y0) 或 fx′(x0,y0)
∂x∂ 和 ∂y∂ 称为偏导算子(partial derivative operator)。
关于自变量 y 的偏导数也是类似的原理。
求偏导数的方法:
- 求关于 x 的偏导数:视 y 为常数,关于 x 对 f 求导。
- 求关于 y 的偏导数:视 x 为常数,关于 y 对 f 求导。
连续性和可偏导的关系:
f(x,y) 在 (x0,y0) 处关于 x 可偏导的充要的条件是 f(x,y0) 在 x0 处可导,
故 f(x,y0) 在 x0 处连续,从而 f(x,y) 在 (x0,y0) 处关于 x 连续。
f(x,y) 在 (x0,y0) 处关于 y 可偏导的充要的条件是 f(x0,y) 在 y0 处可导,
故 f(x0,y) 在 y0 处连续,从而 f(x,y) 在 (x0,y0) 处关于 y 连续。
偏导数的几何意义
函数 z=f(x,y) 在点 P0(x0,y0) 处可偏导。
设 M0(x0,y0,f(x0,y0)) 为曲面 z=f(x,y) 上一点,过点 M0 作平面 y=y0,与曲面相交得到一条去曲线,其方程为:
C1:{z=f(x,y)y=y0
偏导数 fx(x0,y0) 就是曲线 C1 在点 M0 处的切线相对 x 轴的斜率;曲线 C1 在点 M0 的一个切向量为 Tx=(1,0,fx(x0,y0)).
同理,偏导数 fy(x0,y0) 是曲线 C2:{z=f(x,y)x=x0 在点 M0 处的切线相对 y 轴的斜率;曲线 C2 在点 M0 处的一个切向量为 Ty=(0,1,fy(x0,y0)).
高阶偏导数
设函数 x=f(x,y) 在区域 D 内处处存在偏导数 fx(x,y) 和 fy(x,y),如果这两个偏导数仍可偏导,则称它们的偏导数为 z=f(x,y) 的二阶偏导数。二阶偏导数共有四种,分别记作:
∂x∂(∂x∂z)=∂x2∂2z=∂x2∂2f=zxx=fxx(x,y) ∂y∂(∂x∂z)=∂x∂y∂2z=∂x∂y∂2f=zxy=fxy(x,y) ∂x∂(∂y∂z)=∂y∂x∂2z=∂y∂x∂2f=zyx=fyx(x,y) ∂y∂(∂y∂z)=∂y2∂2z=∂y2∂2f=zyy=fyy(x,y)
其中,∂x2∂2z 称为 z 对 x 的二阶偏导数,∂y2∂2z 称为 z 对 y 的二阶偏导数,∂x∂y∂2z 称为 z 先对 x 后对 y 的二阶混合偏导数,∂y∂x∂2z 称为 z 先对 y 后对 x 的二阶混合偏导数。
定理: 若函数 f(x,y) 的两个二阶混合偏导数 fxy(x,y),fyx(x,y) 都在 (x,y) 处连续,则
fxy(x,y)=fyx(x,y)
推广:如果函数 f(x,y) 在区域 D 内处处存在直到 k 阶的所有偏导数,且所有这些偏导数都在 D 内连续,则可记为 f∈C(k)(D),并且 f(x,y) 在 D 内的 k 阶混合偏导数与求偏导的次序无关。
多元函数微分学
全微分与偏微分
设函数 z=f(x,y) 在点 P0(x0,y0) 的某邻域 U(P0) 内有定义,如果函数在 P0 处的全增量
Δz=f(x0+Δx,y0+Δy)−f(x0,y0)
可以表示为
Δz=AΔx+BΔy+o(ρ)
其中 A,B 是不依赖于 Δx,Δy 的常数(但一般与 x0,y0 有关),ρ=Δx2+Δy2,则称函数 z=f(x,y) 在点 P0 处可微(differentiable),称其线性主部 AΔx+BΔy 为函数在 P0 处的全微分(total differentiation),记作 dz,即
dz=AΔx+BΔy
当函数在区域 D 内每一点都可微时,称其为 D 内的可微函数。若可微函数 f 的偏导数在区域 D 内仍然可微,则称 f 在区域 D 内连续可微(continuously differentiable)。
与全微分相对的,还有偏微分。如果函数在 P0 处关于自变量 x 的偏增量
Δxz=f(x0+Δx,y0)−f(x0,y0)
可以表示为
Δxz=AΔx+o(∣Δx∣)
称其线性主部 AΔx 为函数在 P0 处关于自变量 x 的偏微分(partial differentiation),偏微分与偏导数可以联系起来:
AΔx=fx(x0,y0)Δx
利用全微分进行近似计算:
若函数 z=f(x,y) 在点 P0(x0,y0) 处可微,并且 ∣Δx∣,∣Δy∣ 很小时,可以忽略高阶无穷小项,因此有近似等式:
f(x0+Δx,y0+Δy)−f(x0,y0)≈AΔx+BΔy
即
f(x0+Δx,y0+Δy)≈f(x0,y0)+AΔx+BΔy
二元函数中值定理
第一种形式:
设函数 z=f(x) 在矩形域 D={(x,y)∣∣x−x0∣<r1,∣y−y0∣<r2} 内有定义,若 f(x,y) 在 D 内可偏导,则对任意 ∣Δx∣<r1,∣Δy∣<r2,存在 0<θ1,θ2<1,使得
Δz=f(x0+Δx,y0+Δy)−f(x0,y0)=fx(x0+θ1Δx,y0+Δy)Δx+fy(x0+Δx,y0+θ2Δy)Δy
证明:
Δz=[f(x0+Δx,y0+Δy)−f(x0,y0+Δy)]+[f(x0,y0+Δy)−f(x0,y0)]
(x,y0+Δt) 在区域 D 内,所以一元函数 φ(x)=f(x,y0+Δy) 对 x 的导数在 [x0,x0+Δx] 上处处存在。
由拉格朗日中值定理,存在 0<θ1<1,使得
f(x0+Δx,y0+Δy)−f(x0,y0+Δy)=φ(x0+Δx)−φ(x0)=φ′(x0+θ1Δx)Δx=fx(x0+θ1Δx,y0+Δy)Δx
同理,存在 0<θ2<1,使得
f(x0,y0+Δy)−f(x0,y0)=fy(x0,y0+θ2Δy)Δy
综上,可证得上述结论成立。
推论 1: 设函数 z=f(x) 在矩形域 D 内可偏导,且两个偏导数都恒等于零,则在 D 内 f(x,y) 为一常数。
推论 2: 设函数 z=f(x) 在矩形域 D={(x,y)∣∣x−x0∣<r1,∣y−y0∣<r2} 内可偏导,且两个偏导数都有界,则 f(x,y) 在点 (x0,y0) 处连续。
第二种形式:
设函数 z=f(x) 在凸开域 D⊂R2 内可微,则对任意 P(a,b),Q(a+h,b+k)∈D,存在 0<θ<1,使得
Δz=f(a+h,b+k)−f(a,b)=fx(a+θh,b+θk)h+fy(a+θh,b+θk)k
证明:
令 φ(t)=f(a+th,b+tk),它是定义在 [0,1] 上的一元函数,在 [0,1] 上连续并且可微,由拉格朗日中值定理,存在 0<θ<1,使得
f(a+h,b+k)=φ(1)−φ(0)=φ′(θ)
由复合函数求导法则,可得
φ′(θ)=fx(a+θh,b+θk)h+fy(a+θh,b+θk)k
又因为 D 使凸区域,所以 (a+θh,b+θk)∈D,可证得上述结论成立。
二元函数的可微性条件
和一元函数不同,多元函数在一点处连续与可偏导没有蕴涵关系,即连续不一定可偏导,可偏导也不一定连续,我们可以通过必要条件和充分条件来判断函数的可微性。
可微的必要条件:
若函数 z=f(x,y) 在点 P0(x0,y0) 处可微,则
- f(x,y) 在点 P0 处连续;
- f(x,y) 在点 P0 处可偏导,且有 A=fx(x0,y0),B=fy(x0,y0),即
dz=fx(x0,y0)Δx+fy(x0,y0)Δy
证明:
由函数 z=f(x,y) 可微,得
Δz=AΔx+BΔy+o(ρ)
令 (x0,y0)→(0,0),则
(x0,y0)→(0,0)limo(ρ)=(x0,y0)→(0,0)limρo(ρ)Δx2+Δy2=0
故 (x0,y0)→(0,0)limΔz=0,即 f(x,y) 在点 P0 处连续;
特别地,取 Δy=0,则
f(x0+Δx,y0)−f(x0,y0)Δxf(x0+Δx,y0)−f(x0,y0)=AΔx+o(∣Δx∣)=A+Δxo(∣Δx∣)
又因为
Δx→0limΔxo(∣Δx∣)=Δx→0lim∣Δx∣o(∣Δx∣)Δx∣Δx∣=0
于是
A=Δx→0limΔxf(x0+Δx,y0)−f(x0,y0)=fx(x0,y0)
同理可得
B=Δx→0limΔyf(x0,y0+Δy)−f(x0,y0)=fy(x0,y0)
可微的充分条件:
设函数 z=f(x,y) 在点 P0(x0,y0) 的某邻域 U(P0) 内可偏导,若其偏导数 fx(x,y),fy(x,y) 都在点 P0 处连续,则函数 z=f(x,y) 在点 P0 处可微。
证明:
由微分中值定理,对充分小的 Δx,Δy,有
Δz=fx(x0+θ1Δx,y0+Δy)Δx+fy(x0+Δx,y0+θ2Δy)Δy(0<θ1,θ2<0)
再由 fx(x,y),fy(x,y) 在点 (x0,y0) 处连续,有
fx(x0+θ1Δx,y0+Δy)=fx(x0,y0)+α
从而
Δz=fx(x0,y0)Δx+fy(x0,y0)Δy+αΔx+βΔy
又因为
ραΔx+βΔy≤∣α∣ρΔx+∣β∣ρΔy≤∣α∣+∣β∣
所以 (ΔxΔy)→(0,0)limραΔx+βΔy=0,即 αΔx+βΔy 为 ρ 的高阶无穷小,从而
Δz=fx(x0,y0)Δx+fy(x0,y0)Δy+o(ρ)
证得 z=f(x,y) 在点 P0 处可微。
可微性的几何意义:
二元函数 z=f(x,y) 在 P0(x0,y0) 处可微的充要条件是在三维空间中存在点 (x0,y0,f(x0,y0)) 的切平面,并且该平面不平行于 z 轴。
该切平面方程可以表示为:
z−z0=fx(x0,y0)(x−x0)+fy(x0,y0)(y−y0)
该切平面的法线方程可以表示为:
fx(x0,y0)x−x0=fy(x0,y0)y−y0=−1z−z0
详见后文“曲面的切平面与法线”。
高阶全微分
设二元函数 z=f(x,y) 在点 (x,y) 处可微,则
dz=fx(x,y)dx+fy(x,y)dy
若 dz 作为 (x,y) 的函数仍可微,则称函数 f(x,y) 在点 (x,y) 处二阶可微,并称 dz 的微分为 z=f(x,y) 的二阶全微分,记作 d2z,即
d2z=d(dz)=d[fx(x,y)dx+fy(x,y)dy]=dfx(x,y)⋅dx+dfy(x,y)⋅dy
当 fxy(x,y) 和 fxy(x,y) 都连续时,则有
d2z=fxx(x,y)dx2+2fxy(x,y)dxdy+fyy(x,y)dy2
若使用偏导算子符号,则上式可以写作:
d2z=∂x2∂2fdx2+2∂x∂y∂2fdxdy+∂y2∂2fdy2
若 z=f(x,y) 的 n−1 阶全微分 dn−1z 仍可微,则称函数在点 f(x,y) 在点 (x,y) 处 n 阶可微,并称 n−1 阶全微分 dn−1z 的微分为 z=f(x,y) 的 n 阶全微分,记作 dnz。
当 z=f(x,y) 的所有 n 阶偏导数都连续时,有
dnz=(dx∂x∂+dy∂y∂)nf(x,y)=k=0∑nCnk∂xk∂yn−k∂nzdxkdyn−k
复合函数微分法
链式法则:
设函数 z=f(u,v) 及 u=φ(t),v=ψ(t) 可以构成复合函数 z=f[φ(t),ψ(t)],若 u=φ(t),v=ψ(t) 都在点 t 处可导,z=f(u,v) 在对应点 (u,v) 处可微,则复合函数 z=f[φ(t),ψ(t)] 在点 t 处可导,且
dtdz=∂u∂z(u,v)dtdu+∂v∂z(u,v)dtdv
证明:
由于函数 z=f(u,v) 可微,所以有
Δz=∂u∂zΔu+∂v∂zΔv+o(ρ)
上式两端同除 Δt,得
ΔtΔz=∂u∂zΔtΔu+∂v∂zΔtΔv+Δto(ρ)
由于 u=φ(t),v=ψ(t) 都在点 t 处可导,所以当 Δt→0 时,有
ΔtΔu→dtdu,ΔtΔv→dtdv
又因为 Δt→0 时,Δu→0,Δv→0,所以有
Δt→0limΔto(ρ)=Δt→0limρo(ρ)∣Δt∣ρΔt∣Δt∣=Δt→0limρo(ρ)(ΔtΔu)2+(ΔtΔv)2Δt∣Δt∣=0
综上所述,可得
Δt→0limΔtΔz=∂u∂zdtdu+∂v∂zdtdv
推论 1: 设函数 z=f(u,v) 及 u=φ(s,t),v=ψ(s,t) 可以构成复合函数 z=f[φ(s,t),ψ(s,t)],且满足链式法则使用条件,则复合函数 z=f[φ(s,t),ψ(s,t)] 在点 (s,t) 处可偏导,且
∂s∂z=∂u∂z∂s∂u+∂v∂z∂s∂v,∂t∂z=∂u∂z∂t∂u+∂v∂z∂t∂v
推论 2: 设函数 z=f(u,v) 及 u=φ(s,t),v=ψ(t) 可以构成复合函数 z=f[φ(s,t),ψ(t)],且满足链式法则使用条件,则复合函数 z=f[φ(s,t),ψ(t)] 在点 (s,t) 处可偏导,且
∂s∂z=∂u∂z∂s∂u,∂t∂z=∂u∂z∂t∂u+∂v∂zdtdv
链式法则的推广: 一般地,设函数 z=f(y1,y2,⋯,yn) 及 yi=yi(x1,x2,⋯,xm) (i=1,2,⋯,n) 可以构成复合函数,若 yi=yi(x1,x2,⋯,xm) 在点 (x1,x2,⋯,xm) 处可偏导,z=f(y1,y2,⋯,yn) 在对应点可微,则复合函数在点 (x1,x2,⋯,xm) 处可偏导,且
∂xi∂z=j=1∑n∂yj∂z∂xi∂yj(i=1,2,⋯,m)
复合函数微分和高阶偏导数结合:
例:设 z=f(xy,xy),其中 f 二阶可导,求 ∂x∂y∂2z.
解:令 u=xy,v=xy,则复合函数是由 z=f(u,v),u=xy,v=xy 复合而成。
∂x∂z=∂u∂f∂x∂u+∂v∂f∂x∂v=yf1′−x2yf2′
∂x∂y∂2z=f1′+y∂y∂f1′−x21(f2′+∂y∂f2′)=f1′+y(f11′′∂y∂u+f12′′∂y∂v)−x21[f2′+y(f21′′∂y∂u+f22′′∂y∂v)]=f1′+y(f11′′⋅x+f12′′⋅x1)−x21f2′−x2y(f21′′⋅x+f22′′⋅x1)=xyf11′′−x3yf22′′+f1′−x21f2′
一阶微分形式不变性:
设以 u 和 v 为自变量的函数 z=f(u,v) 在点 (u,v) 处可微,则其全微分为
dz=∂u∂zdu+∂v∂zdv
如果 u,v 又是 x,y 的函数 u=φ(x,y),v=ψ(x,y),并且在点 (x,y) 处可微,则复合函数 z=f[φ(x,y),ψ(x,y)] 在点 (x,y) 处也可微,且
dz=∂x∂zdx+∂y∂zdy=[∂u∂z∂x∂u+∂v∂z∂x∂v]dx+[∂u∂z∂y∂u+∂v∂z∂y∂v]dy=∂u∂z[∂x∂udx+∂y∂udy]+∂v∂z[∂x∂vdx+∂y∂vdy]
因为
du=∂x∂udx+∂y∂udy,dv=∂x∂vdx+∂y∂vdy
所以
dz=∂u∂zdu+∂v∂zdv
由此可知,无论 u,v 是自变量还是中间变量,函数 z=f(u,v) 的全微分形式是一样的,这个性质被称为一阶微分形式不变性。
利用一阶微分形式不变性,容易证明以下微分法则对于自变量和中间变量恒成立:
d(u±v)=du±dv,d(uv)=vdu+udv d(vu)=v2vdu−udv(v=0)
对于高阶全微分,不存在对应的形式不变性。
隐函数微分法
对于隐函数微分,我们一般有以下三个方法进行处理:
- 公式法:适用于求一阶偏导数的情况。
- 微分法:等式两端同时求全微分,适用于求关于多个变量的一阶偏导数的情况。
- 偏导法:等式两端同时求偏导数,适用于需要求高阶偏导数的情况。
由单个方程确定的隐函数的微分法:
隐函数存在定理(充分条件): 设二元函数 F(x,y) 满足
- 在点 P(x0,y0) 的某邻域内具有连续偏导数 Fx′,Fy′;
- F(x0,y0)=0 且 Fy(x0,y0)=0.
则方程 F(x,y)=0 在 (x0,y0) 的某邻域内中可以确定唯一一个连续可导的隐函数 y=f(x),满足
F[x,f(x)]=0,f(x0)=y0
并且其导数为
dxdy=−Fy(x,y)Fx(x,y)
推导:因为隐函数 y=f(x) 满足恒等式
F[x,f(x)]=0
其中 F 在 (x0,y0) 的某邻域内具有连续偏导数,f(x) 在点 x0 的某邻域内连续可导,由链式法则,在恒等式两端对 x 求导可得
Fx(x,y)+Fy(x,y)dxdy=0
又因为存在 (x0,y0) 的某邻域,使得在该邻域内 Fy(x,y)=0,所以
dxdy=−Fy(x,y)Fx(x,y)
隐函数存在定理推广: 设三元函数 F(x,y,z) 满足
- 在点 P(x0,y0,z0) 的某邻域内具有连续偏导数 Fx′,Fy′,Fz′;
- F(x0,y0,z0)=0 且 Fy(x0,y0,z0)=0.
则方程 F(x,y,z)=0 在 (x0,y0) 的某邻域内中可以确定唯一一个具有连续偏导数的隐函数 z=f(x,y),满足
F[x,y,f(x,y)]=0,f(x0,y0)=z0
并且其偏导数为
∂x∂z=−Fz′Fx′,∂y∂z=−Fz′Fy′
推导:在恒等式 F[x,y,f(x,y)]=0 两端求微分得
Fxdx+Fydy+Fzdz=0
又因为在 Fz(x0,y0,z0)=0 及 Fz(x,y,z) 连续,所以存在 (x0,y0,z0) 的某邻域,使得在该邻域内 Fz(x,y,z)=0,从而
∂x∂z=−Fz′Fx′,∂y∂z=−Fz′Fy′
由方程组确定的隐函数的微分法:
隐函数存在定理: 设三元函数 F(x,u,v),G(x,u,v) ,我们将 u,v 看作因变量,x 看作自变量,满足
- 在点 P0(x0,u0,v0) 的某邻域内具有对自变量 x 的连续偏导数;
- F(x0,u0,v0)=0,G(x0,u0,v0)=0;
- 在点 P0 处,存在行列式
J=Fu′Gu′Fv′Gv′=0
该行列式称为雅可比行列式(Jacobian determinant),一般可以记作
∂(u,v)∂(F,G)=Fu′Gu′Fv′Gv′
则方程组 {F(x,u,v)=0G(x,u,v)=0 在点 P0 的某邻域内可以确定唯一一对具有连续偏导数的一元函数 {u=u(x)v=v(x),满足
{F(x,u(x),v(x))=0G(x,u(x),v(x))=0,{u(x0)=u0v(x0)=v0
并且其导数为
dxdu=−Fu′Gu′Fv′Gv′Fx′Gx′Fv′Gv′,dxdv=−Fu′Gu′Fv′Gv′Fu′Gu′Fx′Gx′
推导:在恒等式 {F(x,u(x),v(x))=0G(x,u(x),v(x))=0 两边取微分,得
{Fxdx+Fudu+Fvdv=0Gxdx+Gudu+Gvdv=0
由于在点 P0 处 J=0,并且 Fu,Fv,Gu,Gv 连续,所以存在 P0 的某邻域,使得在该邻域内 J=0,从而
du=J1−Fx′dx−Gx′dxFv′Gv′dv=J1Fu′Gu′−Fx′dx−Gx′dx
隐函数存在定理推广: 设四元函数 F(x,y,u,v),G(x,y,u,v) ,我们将 u,v 看作因变量,x,y 看作自变量,满足
- 在点 P0(x0,y0,u0,v0) 的某邻域内具有对每个自变量的连续偏导数;
- F(x0,y0,u0,v0)=0,G(x0,y0,u0,v0)=0;
- 在点 P0 处,存在行列式
J=∂(u,v)∂(F,G)=0
则方程组 {F(x,y,u,v)=0G(x,y,u,v)=0 在点 P0 的某邻域内可以确定唯一一对具有连续偏导数的二元函数 {u=u(x,y)v=v(x,y),满足
{F(x,y,u(x,y),v(x,y))=0G(x,y,u(x,y),v(x,y))=0,{u(x0,y0)=u0v(x0,y0)=v0
并且其偏导数为
∂x∂u=−J1∂(x,v)∂(F,G),∂x∂v=−J1∂(u,x)∂(F,G),∂y∂u=−J1∂(y,v)∂(F,G),∂y∂v=−J1∂(u,y)∂(F,G)
例 1:设 F(x,y,x−z,y2−u)=0,其中 F 拥有二阶连续偏导数,且 F4′=0,求 ∂y2∂2u.
解:把 u 看作因变量,对方程两端关于自变量 y 求偏导,得
F2′+F4′⋅(2y−uy)uy=0=2y+F4′F2′
对第一次求偏导得到的等式两端再对 y 求偏导,得
F22′′+F24′′⋅(2y−uy)+[F42′′+F44′′⋅(2y−uy)](2y−uy)+F4′⋅(2−uyy)=0
因为 F 的二阶偏导数连续,所以 F24′′=F42′′,代入 2y−uy=−F4′F2′,可将上式转化为
F22′′−2F4′F2′F24′′+(F4′F2′)2F44′′+F4′(2−uyy)=0
上式两端同除以 F4′,最终得到
∂y2∂2u=uyy=2+F4′1F22′′−2F4′2F2′F24′′+F4′3F2′2F44′′
例 2:设 u=f(x,y,xyz),函数 z=z(x,y) 由方程
exyz=∫xyzg(xy+z−t)dt
确定,其中 f 具有连续偏导数,g 连续,求 x∂x∂u−y∂y∂u.
解:
∂x∂u=f1′+f3′⋅(yz+xy∂x∂z)∂y∂u=f2′+f3′⋅(xz+xy∂y∂z)
令 w=xy+z−t,则 t=−w+xy+z,原方程转化为
exyz=∫zxyg(w)d(−w+xy+z)=∫xyzg(w)dw
在方程两端同时对自变量 x 求导,可得
exyz(yz+xy∂x∂z)∂x∂z=g(z)∂x∂z−yg(xy)=g(z)−xyexyzyzexyz+yg(xy)
同理可得
∂y∂z=g(z)−xyexyzxzexyz+xg(xy)
因此
x∂x∂u−y∂y∂u=x[f1′+f3′⋅(yz+xyg(z)−xyexyzyzexyz+yg(xy))]−y[f2′+f3′⋅(xz+xyg(z)−xyexyzxzexyz+xg(xy))]=xf1′−yf2′
雅可比行列式的性质:
链式法则: 设函数 zi=fi(u1,u2,⋯,un) (i=1,2,⋯,n) 在区域 U⊂Rn 内具有连续偏导数,而函数 uj=φj(x1,x2,⋯,xn) (j=1,2,⋯,n) 在区域 X⊂Rn 内具有连续偏导数,并且当 (x1,x2,⋯,xn)∈X 时,对应点 (u1,u2,⋯,un)∈U,则有
∂(x1,x2,⋯,xn)∂(z1,z2,⋯,zn)=∂(u1,u2,⋯,un)∂(z1,z2,⋯,zn)⋅∂(x1,x2,⋯,xn)∂(u1,u2,⋯,un)
可逆性: 设函数 yi=fi(x1,x2,⋯,xn) (i=1,2,⋯,n) 在区域 X⊂Rn 内具有连续偏导数,并且
J=∂(x1,x2,⋯,xn)∂(y1,y2,⋯,yn)=0
则存在其反函数 xj=φj(y1,y2,⋯,yn) (j=1,2,⋯,n),同样在区域 X 内具有连续偏导数,并且
∂(x1,x2,⋯,xn)∂(y1,y2,⋯,yn)⋅∂(y1,y2,⋯,yn)∂(x1,x2,⋯,xn)=1
方向导数与梯度
方向导数
为了引出方向导数的概念,我们首先从二维的情形开始探讨。想象 l 为平面上的非零向量,其方向余弦(向量与坐标轴夹角的余弦值) 为 cosα,cosβ,则 el=(cosα,cosβ) 是与 l 同方向的单位向量。过平面上一点 P0(x0,y0),以 l 为方向向量作一条射线 L,其参数方程为
{x=x0+tcosα,y=y0+tcosβ,0≤t<+∞
设 P(x,y)=(x0+tcosα,y0+tcosβ) 为 L 上任意一点,可以写出以下极限
t→0+limtf(P)−f(P0)
若当点 P 沿着射线趋于 P0 时该极限存在,那么该极限反映了函数在点 P0 处沿方向 l 的变化率,这便是方向导数(directional derivative)。
定义: 设函数 z=f(x1,⋯,xn) 在点 x 的某邻域 U(x) 内有定义,l 是一非零向量,el 是与 l 同方向的单位向量,若极限
t→0+limtf(x+tel)−f(x)
存在,则称此极限值为函数 z=f(x1,⋯,xn) 在点 x 处沿方向 l 的方向导数,记作 ∂l∂fx,即
∂l∂fx=t→0+limtf(x+tel)−f(x)
定理: 若函数 z=f(x1,⋯,xn) 在点 x 处可微,则沿着任意非零向量 l 的方向导数都存在,并且
∂l∂fx=dfx(el)
该公式在二维情形下可以写作:
∂l∂f(x0,y0)=fx(x0,y0)cosα+fy(x0,y0)cosβ
证明:
由于 f(x,y) 在 (x0,y0) 处可微,所以
f(x0+Δx,y0+Δy)−f(x0,y0)=fx(x0,y0)Δx+fy(x0,y0)Δy+o(Δx2+Δy2)
当 (x0+Δx,y0+Δy) 在以 (x0,y0) 为起点,l 为方向的射线上时,有 Δx=tcosα,Δy=tcosβ,则
f(x0+tcosα,y0+tcosβ)−f(x0,y0)=fx(x0,y0)tcosα+fy(x0,y0)tcosβ+o(t)
从而
t→0+limtf(x0+tcosα,y0+tcosβ)−f(x0,y0)=fx(x0,y0)cosα+fy(x0,y0)cosβ
梯度
在空间的每一个点都可以确定无限多个方向,一个多元函数在某个点也必然有无限多个方向导数。为了研究导数在这无限多个方向导数中最大的一个(它直接反映了函数在这个点的变化率的数量级),我们引入了梯度(gradient) 的概念。
定义: 设函数 z=f(x1,⋯,xn) 在点 x 处可偏导,则它在该点处的梯度定义为
(∇f(x))⋅el=∂l∂fx
其中 ∇ 为 Nabla 算子,∇f(x) 表示函数 f 在点 x 处的梯度,它的本质是一个向量。
在二维情形下,梯度的计算公式可以写成如下形式:
∇f(x0,y0)=fx(x0,y0)i+fy(x0,y0)j
在三维情形下,梯度的计算公式可以写成如下形式:
∇f(x0,y0,z0)=fx(x0,y0,z0)i+fy(x0,y0,z0)j+fz(x0,y0,z0)k
梯度的性质:
梯度和导数有着类似的性质(本质就是另一种形式的导数):
- ∇(c1u+c2v)=c1∇u+c2∇v,c1,c2 为常数;
- ∇(uv)=v∇u+u∇v;
- ∇(vu)=v2v∇u−u∇v,v=0;
- ∇f(u)=f′(u)∇u,f 为可微函数。
梯度与方向导数的关系:
由于
(∇f(x))⋅el=∣∇f(x)∣⋅∣el∣⋅cosθ=∣∇f(x)∣cosθ
其中 θ 是梯度 ∇f 与向量 l 的夹角。
可以看出,当 l 与梯度方向一致时,有
∂l∂fx=∣∇f(x)∣
当 l 与梯度方向相反时,有
∂l∂fx=−∣∇f(x)∣
即函数 f 在点 x 处沿梯度 ∇f 方向的方向导数最大,最大值为 ∣∇f(x)∣;而沿梯度 ∇f 相反方向的方向导数最小,最小值为 −∣∇f(x)∣.
多元微分学的几何应用
曲线的切线和法平面
设 Γ 是空间内一条曲线,M0 是 Γ 上一定点,M 是 Γ 上任意一点,过 M0,M 两点的直线 M0M 称作 Γ 的割线(secant)。如果当点 M 沿曲线 Γ 趋于点 M0 时,割线 M0M 存在极限位置 M0T,则称直线 M0T 为曲线 Γ 在点 M0 处的切线(tangent)。
过点 M0 且与切线 M0T 垂直的平面 π 称为曲线 Γ 在点 M0 的法平面(normal plane)。
参数方程作曲线方程:
设空间曲线 Γ 用参数方程表示为
⎩⎨⎧x=x(t)y=y(t)z=z(t)
点 M0(x0,y0,z0)∈Γ 对应于参数 t=t0,函数 x(t),y(t),z(t) 在 t0 处的导数均存在,并且不全为零。
设动点 M(x,y,z)∈Γ 对应于参数 t=t0+Δt (Δt=0),则割线 M0M 的方向向量为
(x−x0,y−y0,z−z0)=(Δx,Δy,Δz)
将上式乘以 Δt1,可得
(ΔtΔx,ΔtΔy,ΔtΔz)
令 Δt→0,即 M→M0,割线 M0M 的方向向量的极限即为切线 M0T 的方向向量,记作切向量 s,并且
s=(x′(t0),y′(t0),z′(t0))
则曲线 Γ 在点 M0 的切线 M0T 的方程为:
x′(t0)x−x0=y′(t0)y−y0=z′(t0)z−z0
法平面 π 的方程为:
x′(t0)(x−x0)+y′(t0)(y−y0)+z′(z0)(z−z0)=0
一般方程作曲线方程:
设空间曲线 Γ 用一般方程表示为
{F(x,y,z)=0G(x,y,z)=0
点 M0(x0,y0,z0)∈Γ,函数 F(x,y,z),G(x,y,z) 在 M0 的某领域内具有连续偏导数,并且对应的雅可比行列式
m=∂(y,z)∂(F,G)M0,n=∂(z,x)∂(F,G)M0,p=∂(x,y)∂(F,G)M0
不全为零。
则曲线 Γ 在点 M0 处的切向量为
s=(m,n,p)
或用行列式记为
s=iFx′Gx′jFy′Gy′kFz′Gz′M0
曲线 Γ 在点 M0 处的切线方程为:
mx−x0=ny−y0=pz−z0
法平面方程为:
m(x−x0)+n(y−y0)+p(z−z0)=0
曲面的切平面与法线
设 Σ 是空间内一曲面,Γ 是 Σ 上经过点 M0 的任意一条曲线,所有这些曲线在点 M0 处的切线都与同一向量 n 垂直,因此这些切线共面,而这个平面就称为曲面 Σ 在点 M0 处的切平面(tangent plane)。
过点 M0 且垂直于切平面的直线称为曲面 Σ 在点 M0 处的法线(normal),n 为切平面的法向量,也称为曲面 Σ 在点 M0 处的法向量。
隐函数作曲面方程:
设曲面 Σ 的方程为
F(x,y,z)=0
点 M0(x0,y0,z0)∈Σ,函数 F(x,y,z) 在点 M0 的某领域内具有连续偏导数,并且 Fx(M0),Fy(M0),Fz(M0) 不全为零。
在曲面 Σ 上过点 M0 任作一条曲线 Γ,设 Γ 用参数方程表示为
⎩⎨⎧x=x(t)y=y(t)z=z(t)
点 M0(x0,y0,z0) 对应于参数 t=t0,函数 x(t),y(t),z(t) 在 t0 处的导数均存在,并且不全为零。
由于曲线 Γ 在曲面 Σ 上,所以有 F[x(t),y(t),z(t)]=0,对等式两端关于 t 求导,并令 t=t0,可得
Fx(M0)x′(t0)+Fy(M0)y′(t0)+Fz(M0)z′(t0)=0
因此,曲面 Σ 在点 M0 处的法向量 n 就是函数 F(x,y,z) 在点 M0 处的梯度:
n=∇f(M0)=(Fx(M0),Fy(M0),Fz(M0))
法线方程为:
Fx(M0)x−x0=Fy(M0)x−x0=Fz(M0)x−x0
切平面方程为:
Fx(M0)(x−x0)+Fy(M0)(y−y0)+Fz(M0)(z−z0)=0
二元函数作曲面方程:
设曲面 Σ 的方程为
z=f(x,y)
点 M0(x0,y0,z0)∈Σ,其中 z0=f(x0,y0),函数 f(x,y) 在点 (x0,y0) 的某邻域内具有连续偏导数。
则曲面 Σ 在点 M0 处的法向量为:
n=(fx(x0,y0),fy(x0,y0),−1)
法线方程为:
fx(x0,y0)x−x0=fy(x0,y0)y−y0=−1z−z0
切平面方程为:
z−z0=fx(x0,y0)(x−x0)+fy(x0,y0)(y−y0)
参数方程作曲面方程:
设曲面 Σ 的方程为
⎩⎨⎧x=x(u,v)y=y(u,v)z=z(u,v)
点 M0(x0,y0,z0)∈Σ 对应于参数 u=u0,v=v0,函数 x(u,v),y(u,v),z(u,v) 在 P0(u0,v0) 的某邻域内具有连续偏导数,并且
ixuxvjyuyvkzuzvP0=(∂(u,v)∂(y,z),∂(u,v)∂(z,x),∂(u,v)∂(x,y))P0=0
记
A=∂(u,v)∂(y,z)P0,B=∂(u,v)∂(z,x)P0,C=∂(u,v)∂(x,y)P0
则曲面 Σ 在点 M0 处的法向量为:
n=(A,B,C)
法线方程为:
Ax−x0=By−y0=Cz−z0
切平面方程为:
A(x−x0)+B(y−y0)+C(z−z0)=0
多元函数泰勒公式
在多元函数中存在着和一元函数类似的泰勒展开公式,模仿一元函数的形式,我们有如下定理:
定理: 设二元函数 f(x,y) 在点 (x0,y0) 的某领域内具有 n+1 阶连续偏导数,(x0+Δx,y0+Δy)∈U(x0,y0),则 f 在点 (x0,y0) 处存在 n 阶泰勒公式:
f(x0+Δx,y0+Δy)=f(x0,y0)+k=1∑nk!1(Δx∂x∂+Δy∂y∂)kf(x0,y0)+Rn
规定
(Δx∂x∂+Δy∂y∂)kf=i=0∑kCkiΔxk−iΔyi∂xk−i∂yi∂kf(k=1,2,⋯,n+1)
其中 Rn 为拉格朗日型余项,令 θ∈(0,1),其完整形式如下:
Rn=(n+1)!1(Δx∂x∂+Δy∂y∂)n+1f(x0+θΔx,y0+θΔy)
下面给出了带有拉格朗日型余项的二阶泰勒公式:
f(x,y)=f(x0,y0)+[fx(x0,y0)Δxfy(x0,y0)Δy]+21[fxx(x0,y0)(Δx)2+2fxy(x0,y0)ΔxΔy+fyy(x0,y0)(Δy)2]+Rn
Rn=3!1[fxxx(x0+θΔx,y0+θΔy)(Δx)3+3fxxy(x0+θΔx,y0+θΔy)(Δx)2(Δy)+3fxyy(x0+θΔx,y0+θΔy)(Δx)(Δy)2+fyyy(x0+θΔx,y0+θΔy)(Δy)3]
皮亚诺型余项: 设二元函数 f(x,y) 在点 (x0,y0) 的某领域内具有 n 阶连续偏导数,则当 ρ=Δx2+Δy2→0 时,f 在点 (x0,y0) 处存在 n 阶泰勒公式:
f(x0+Δx,y0+Δy)=f(x0,y0)+k=1∑nk!1(Δx∂x∂+Δy∂y∂)kf(x0,y0)+o(ρn)
当 (x0,y0)=(0,0) 时,n 阶泰勒公式可以转化为 n 阶麦克劳林公式。
黑塞矩阵
设 n 元函数 f(x) 具有二阶连续偏导数,其中 x=(x1,x2,⋯,xn),则由 f 的二阶偏导数组成的方阵:
H(x)=∂x12∂2f∂x2∂x1∂2f⋮∂xn∂x1∂2f∂x1∂x2∂2f∂x22∂2f⋮∂xn∂x2∂2f⋯⋯⋱⋯∂x1∂xn∂2f∂x2∂xn∂2f⋮∂xn2∂2f
这个方阵被称作黑塞矩阵(Hessian matrix),它的每一个元素为
Hij=∂xi∂xj∂2f
令 f 为二元函数,则 x0=(x0,y0),Δx=(Δx,Δy),此时对应的黑塞矩阵为
H(x0,y0)=∂x2∂2f(x0,y0)∂y∂x∂2f(x0,y0)∂x∂y∂2f(x0,y0)∂y2∂2f(x0,y0)
可以看出,f(x) 的二阶泰勒展开式可以用梯度和黑塞矩阵改写为
f(x0+Δx)=f(x0)+∇f(x0)⋅Δx+21ΔxH(x0)ΔxT+o(ρ2)
多元函数的极值问题
极值与最值
极值的定义: 设 n 元函数 f(x) 在点 x0 的某邻域 U(x0) 内有定义,若 ∀x∈U˚(x0),恒有
f(x)<f(x0)(f(x)>f(x0))
则称 f(x) 在点 x0 处取得极大值(极小值),点 x0 称为 f(x) 的极大值点(极小值点)。
函数取极值的必要条件: 设 n 元函数 f(x) 在点 x0 处可偏导,则当函数在该点取得极值时,有
∂xi∂f(x0)=0(i=1,2,⋯,n)
即
∇f(x0)=0
称满足 ∇f(x0)=0 的点 x0 为函数 f(x) 的驻点。
函数取极值的充分条件: 设 n 元函数 f(x) 在点 x0 的某邻域 U(x0) 内具有二阶偏导数,x0 为 f(x) 的驻点,H(x0) 是 f(x) 在点 x0 处的黑塞矩阵,则
- 若 H(x0) 为正定矩阵,则 f 在点 x0 处取得极小值;
- 若 H(x0) 为负定矩阵,则 f 在点 x0 处取得极大值;
- 若 H(x0) 为不定矩阵,则 f 在点 x0 处无极值;
- 若 H(x0) 为半正定或半负定矩阵,则 f 在点 x0 处是否有极值无法确定。
有关正定二次型与正定矩阵相关内容,见 矩阵代数(三):特征值与二次型。
推论: 设二元函数 f(x,y) 在点 (x0,y0) 的某邻域 U(x0,y0) 内具有二阶偏导数,(x0,y0) 是 f(x,y) 的驻点,记
A=fxx(x0,y0),B=fxy(x0,y0),C=fyy(x0,y0)
则
- 若 AC−B2>0,且 A>0,则 f 在点 (x0,y0) 处取得极小值;
- 若 AC−B2>0,且 A<0,则 f 在点 (x0,y0) 处取得极大值;
- 若 AC−B2<0,则 f 在点 (x0,y0) 处无极值;
- 若 AC−B2=0,则 f 在点 (x0,y0) 处是否有极值无法确定。
最值的求解方法:
设 Ω 为 Rn 中的有界闭区域,n 元函数 f(x) 在 Ω 上具连续偏导数,则 f(x) 在 Ω 上必有最大值和最小值,它们在 Ω 的内部或边界 ∂Ω 上取到,如果 f(x) 在 Ω 内的点 x0 处取得最值,则 x0 必是 f(x) 的极值点。
因此,我们可以用以下方法求 f(x) 在 Ω 上的最值:
- 先求出 f(x) 在 Ω 内的可能极值点的函数值;
- 再求出 f(x) 在 ∂Ω 上的最值;
- 将这些函数值进行比较,其中最大的就是 f(x) 在 Ω 上的最大值,最小的就是 f(x) 在 Ω 上的最小值。
例:设 D 是由 x 轴,y 轴以及直线 x+y=6 围成的三角形区域,求函数 z=f(x,y)=x2y(4−x−y) 在 D 上的最大值与最小值。
解:
fx(x,y)fy(x,y)=2xy(4−x−y)−x2y=x2(4−x−y)−x2y
令 fx(x,y)=0,fy(x,y)=0,可得 f 在 D 内唯一的驻点 (2,1),f(2,1)=4.
在 x 轴上:y=0,f(x,y)=0;
在 y 轴上:x=0,f(x,y)=0.
在直线 x+y=6 上:y=6−x,可得
z=φ(x)=f(x,6−x)=2x3−12x2,x∈[0,6]
按照一元函数的方法,求导得
dxdz=6x2−24x
令 z′=0,得 φ(x) 在 (0,6) 内唯一驻点 x=4,所以 φ(x) 在 [0,6] 上最大值为 0,最小值为 φ(4)=−64.
综上所述,最小值为 f(4,2)=−64.
条件极值(拉格朗日乘数法)
我们将目标函数 f(x) 在定义域内满足某种条件时取到的极值称为条件极值(conditional extremum),该条件通常以方程的形式表述,称为约束方程,记作 φ(x)=0。
定理: 设 x,x0∈Rn,n 元函数 f(x),φ(x) 在 U(x0) 上有一阶连续偏导数,且 ∇φ(x0)=0,若 x0 是目标函数 f(x) 在约束条件 φ(x)=0 下的极值点,则存在常数 λ,使得 ∇f(x0)+λ∇φ(x0)=0.
令 x=(x,y,z),x0=(x0,y0,z0),则
⎩⎨⎧fx(x0)+λφx(x0)=0fy(x0)+λφy(x0)=0fz(x0)+λφz(x0)=0
证明:
记由方程 φ(x)=0 所确定的曲面为 Σ,则点 x0∈Σ,设 Γ:⎩⎨⎧x=x(t)y=y(t)z=z(t) 是 Σ 上过点 x0 的任意一条光滑曲线,且点 x0 对应的参数 t=t0,则按假设 f[x(t),y(t),z(t)] 必在 t0 处取极值,从而
dtdf[x(t),y(t),z(t)]t=t0=0
即
fx(x0)x′(t0)+fy(x0)y′(t0)+fz(x0)z′(t0)=0
记 s=(x′(t0),y′(t0),z′(t0)),它是曲线 Γ 上在点 x0 处的切向量,于是
∇f(x0)⋅s=0
由此可知向量 ∇f(x0) 垂直于曲面 Σ 在点 x0 处的切平面。又因为 ∇φ(x0)=0,可得
n=∇φ(x0)=(φx(x0),φy(x0),φz(x0))
为曲面 Γ 在点 x0 处得切平面的法向量,所以 ∇f(x0) 与 ∇φ(x0) 平行,即存在常数 λ,使得
∇f(x0)=−λ∇φ(x0)
即
∇f(x0)+λ∇φ(x0)=0
应用: 引入辅助函数
L(x,λ)=f(x)+λφ(x)
称该辅助函数为拉格朗日函数,参数 λ 为拉格朗日乘数。
若 x0 是方程组
{∇L=∇f(x0)+λ∇φ(x0)=0Lλ=φ(x)=0
的解,那么 x0 是目标函数 f(x) 在约束条件 φ(x)=0 下的可能极值点。
例:求函数 f(x,y)=x2−y2+2 在椭圆域 D={(x,y)∣x2+4y2≤1} 上的最大值和最小值。
解:先求 D 内部的驻点:
fx=2x,fy=−2y
令
{fx=2x=0fy=−2y=0
解得 x=0,y=0.
再求 D 边界上的驻点:所设拉格朗日函数为
F(x,y,λ)=x2−y2+λ(x2+4y2−1)
则令
⎩⎨⎧Fx=2x+2λx=0Fy=−2y+2λy=0Fλ=x2+4y2−1=0
解得 (±1,0),(0,±2),又因为
f(±1,0)=3,f(0,±2)=−2,f(0,0)=2
所以最大值为 3,最小值为 -2.