偏导数与全微分
偏导数与全微分的概念
如今,咱们把导数和微分的概念,推广到多元函数的情形。只不过,在二维以上,函数的方向十分复杂,毫不只有左导数和右导数两个方向。然而,咱们能够先对某个变元求导数,称为偏导数。html
定义14.1(偏导数)
f(x1,x2,⋯,xn)在
(x10,⋯,xn0)的某个邻域上有定义,若是对第
i(1≤i≤n)的变元,极限
Δxi→0limΔxif(x10,⋯,xi−10,xi,xi+10,⋯,xn0)−f(x10,⋯,xn0)存在,称该极限为
f(x1,⋯,xn)在
(x10,⋯,xn0)处对
xi的偏导数,\记为
∂xi∂f(x10,⋯,xn0)或
fi(x10,⋯,xn0)web
若是
f(x1,⋯,xn)在某个开集
E上每一个点对全部变元的偏导数都存在,那么,对各个变元的偏导数,都是这个开集上的一个
n元函数,一样能够讨论极限、连续性的等概念。
咱们再一元函数上还有微分的概念,在一元函数上,全微分定义成某点的"切线",在二元函数上,全微分就应该是某点的切平面,在三维以上,就是切“超平面”,只不过,这时咱们没有几何直观能够参考。
一维上的直线能够表为
y=a+bx
二维上的平面可表为
y=a+b1x+b2x
推广到
n维上,超平面可表为
y=a+∑k=1nbkxk
所谓全微分,就是在函数在某点附近,能够用一个超平面近似,即:
f(x)=f(x0)+k=1∑nbkΔxk+o(∣∣Δx∣∣)算法
定义14.2(全微分)
f(x1,⋯,xn)在
x0=(x10,⋯,xn0)的某个邻域上有定义,若是
f(x1,⋯,xn)可表为
f(x1,⋯,xn)=f(x10,⋯,xn0)+k=1∑nAk(xk−xk0)+o(∣∣x−x0∣∣)其中
A1,⋯,An和
Δx=x−x0无关,则称
f(x)在
x0处可微,超平面
∑k=1nAkdxk称为
f(x)在
x0处的全微分,记为
df=∑k=1nAkdxk数组
定理14.1(可微的必要条件)
f(x1,⋯,xn)在
x0=(x10,⋯,xn0)的某个邻域上有定义,
f(x1,⋯,xn)在
x0=(x10,⋯,xn0)上可微,则
f在
x0=(x10,⋯,xn0)对各变元可求偏导,而且:
df=k=1∑nfk(x10,⋯,xn0)dxkapp
这由全微分的定义能够直接验证。其次,容易验证可微必连续。但就算n元函数在某点对各变元可求偏导且连续,也不必定可微。ide
例14.1
f(x,y)={x2+y2
xy0x2+y2>0x=0,y=0在
f(x,y)在
(0,0)处连续且对各变元可求偏导,然而:
(x,y)→(0,0)limx2+y2
f(x,y)=(x,y)→(0,0)limx2+y2xy极限不存在,所以,
f(x,y)在
(0,0)点不可微svg
那么,知足何种条件可以可微呢?下面咱们给出一个充分条件:函数
定理14.2(可微的充分条件)
f(x1,⋯,xn)在
x0=(x10,⋯,xn0)的某个邻域上有定义且对各变元可求偏导,而且各偏导在
x0处连续,则
f(x1,⋯,xn)在
x0处可微spa
证:
f(x1,⋯,xn)−f(x10,⋯,xn0)=f(x1,⋯,xn)−f(x10,⋯,xn0)+k=1∑n−1(−f(x10,⋯,xk0,xk+1,⋯,xn)+f(x10,⋯,xk0,xk+1,⋯,xn))=k=1∑n[f(x10,⋯,xk−10,xk,xk+1,⋯,xn)−f(x10,⋯,xk0,xk+1,⋯,xn)] 由拉格朗日中值定理,存在
ξk介于
xk和
xk0之间
f(x1,⋯,xn)=f(x10,⋯,xn0)+k=1∑nfk(x10,⋯,xk−10,ξk,xk+1,⋯,xn)Δxk=k=1∑nfk(x10,⋯,xn0)Δxk+k=1∑n[fk(x10,⋯,xk−10,ξk,xk+1,⋯,xn)−fk(x10,⋯,xn0)]Δxk考察余项:
∑k=1nΔ2xk
f(x1,⋯,xn)−f(x10,⋯,xn0)−∑k=1nfk(x10,⋯,xn0)Δxk=k=1∑n[fk(x10,⋯,xk−10,ξk,xk+1,⋯,xn)−fk(x10,⋯,xn0)]∑i=1nΔ2xi
Δxk
∣∑i=1nΔ2xi
Δxk∣≤1所以:
∣∑k=1nΔ2xk
f(x1,⋯,xn)−f(x10,⋯,xn0)−∑k=1nfk(x10,⋯,xn0)Δxk∣≤k=1∑n∣fk(x10,⋯,xk−10,ξk,xk+1,⋯,xn)−fk(x10,⋯,xn0)∣再由偏导数的连续性,就有
(x1,⋯,xn)→(x10,⋯,xn0)lim∣∑k=1nΔ2xk
f(x1,⋯,xn)−f(x10,⋯,xn0)−∑k=1nfk(x10,⋯,xn0)Δxk∣=0所以,
f(x1,⋯,xn)在
(x10,⋯,xn0)处可微orm
咱们把偏导数连续称为连续可微。这样,可微、可导和连续性的关系能够归纳为:
(1)连续可微必定可微
(2)可微必定可求偏导数
(3)可微必定连续
(4)连续不必定可求偏导
(5)可求偏导不必定可微
多元函数微分法则
为了给出多元情形下的求导和微分法则,咱们首先给出向量值函数的全微分概念
定义14.3
g(x1,x2,⋯,xn)=(g1(x1,⋯,xn),⋯,gm(x1,⋯,xn))是
n元
m维向量值函数,在
(x10,⋯,xn0)附近有定义,若是存在与
(x1,⋯,xn)无关,仅与
(x10,⋯,xn0)有关的
m行
n列矩阵
A,记
Δx=(x1−x10,⋯,xn−xn0)T,使得
⎣⎡g1(x1,⋯,xn)−g1(x10,⋯,xn0)⋯gm(x1,⋯,xn)−gm(x10,⋯,xn0)⎦⎤=AΔx+⎣⎡o1(∣∣Δx∣∣)⋯om(∣∣Δx∣∣)⎦⎤则称向量值函数
g在
(x10,⋯,xn0)处可微,矩阵
A称为
g在
(x10,⋯,xn0)处的Frechet导数。
Adx称为
g在
(x10,⋯,xn0)处的全微分。
实际上,由定义容易得出,若是向量值函数在
(x10,⋯,xn0)处可微的充要条件是每一个份量函数都在
(x10,⋯,xn0)处可微,而且,Frechet导数就等于:
⎣⎢⎡∂x1∂g1(x10,⋯,xn0)⋯∂x1∂gm(x10,⋯,xn0)⋯⋯⋯∂xn∂g1(x10,⋯,xn0)⋯∂xn∂gm(x10,⋯,xn0)⎦⎥⎤为了方便,咱们把Frechet导数记为
g′(x0),对
n元函数来讲,Frechet导数就是
n维的行向量。实际上,Frechet导数就是一元导数的的一个推广,Frechet可导就等价于可微,在这层意义下,可微和可导是等价的。
定理14.3(线性性质)
g1,g2是
n元
m维向量值函数而且都在
(x10,⋯,xn0)处可微,则
(1)
g1+g2在
(x10,⋯,xn0)处可微,而且
g1′(x10,⋯,xn0)+g2′(x10,⋯,xn0)=(g1+g2)′(x10,⋯,xn0)(2)
c是任意实数,
cg1在
(x10,⋯,xn0)处可微,而且
cg1′(x10,⋯,xn0)=(cg1)′(x10,⋯,xn0)
这两个性质按照Frechet导数的定义是显然的。
定理14.4
g是
n元
m维向量值函数,而且在
(x10,⋯,xn0)处可微,
f是
n元函数,而且在
(x10,⋯,xn0)处可微,则
F=g(x1,⋯,xn)f(x1,⋯,xn)在
(x10,⋯,xn0)处可微,而且
F′(x10,⋯,xn0)=g(x10,⋯,xn0)f′(x10,⋯,xn0)+g′(x10,⋯,xn0)f(x10,⋯,xn0)
在理解定理14.4时,须要注意的是
fg是
n元
m维向量值函数,其Frechet导数是
m行
n列矩阵,等式右边第一项中:
g是
m行的列向量,
f′是
n列的行向量,而第二项是一个数乘的形式。经过定理14.4,多元导数就和一元导数在乘法运算法则上统一块儿来了。下面证实定理14.4
证:
首先
g(x1,⋯,xn)f(x1,⋯,xn)−g(x10,⋯,xn0)f(x10,⋯,xn0)=g(x1,⋯,xn)f(x1,⋯,xn)−g(x10,⋯,xn0)f(x1,⋯,xn)+g(x10,⋯,xn0)f(x1,⋯,xn)−g(x10,⋯,xn0)f(x10,⋯,xn0)其次,由可微性,就有
g(x1,⋯,xn)−g(x10,⋯,xn0)=g′(x10,⋯,xn0)Δx+o1(∣∣Δx∣∣)
f(x1,⋯,xn)−f(x10,⋯,xn0)=f′(x10,⋯,xn0)Δx+o2(∣∣Δx∣∣)再令
h(x1,⋯,xn)=f(x1,⋯,xn)o1(∣∣Δx∣∣)+[f(x1,⋯,xn)−f(x10,⋯,xn0)]Δx+g(x10,⋯,xn0)o2(∣∣Δx∣∣)因为
∣∣∣Δx∣∣Δxk∣≤1再由
f(x1,⋯,xn)
在
(x10,⋯,xn0)处的连续性,就有
∣∣Δx∣∣→0lim∣∣Δx∣∣[f(x1,⋯,xn)−f(x10,⋯,xn0)]Δx=0所以
∣∣Δx∣∣→0lim∣∣Δx∣∣h(x1,⋯,xn)=0而
F(x1,⋯,xn)−F(x10,⋯,xn0)=[g(x10,⋯,xn0)f′(x10,⋯,xn0)+g′(x10,⋯,xn0)f(x10,⋯,xn0)]Δx+h(x1,⋯,xn)
接下来咱们给出多元下的复合函数求导法则:
定理14.5
f是
n元
m维向量函数,在
(x10,⋯,xn0)处可导,
(y10,⋯,ym0)=f(x10,⋯,xn0),
g是
m元
k维向量函数,在
(y10,⋯,ym0)处可导,则
f(g(x1,⋯,xn))在
(x10,⋯,xn0)处可导,而且
(g(f(x10,⋯,xn0)))′=g′(f(x10,⋯,xn0))f′(x10,⋯,xn0)
证:
g在
(y10,⋯,ym0)可微,则
g(y1,⋯,ym)−g(y10,⋯,ym0)=g′(y10,⋯,ym0)Δy+o1(∣∣Δy∣∣)(1)再由
f在
(x10,⋯,xn0)处可微,则
f(x1,⋯,xn)−(y10,⋯,ym0)=f′(x10,⋯,xn0)Δx+o2(∣∣Δx∣∣)(2)而
∣∣Δx∣∣∣∣f(x1,⋯,xn)−(y1,⋯,ym)∣∣=∣∣∣∣Δx∣∣f′(x10,⋯,xn0)Δx+o2(∣∣Δx∣∣)∣∣由范数的性质,有
∣∣∣∣Δx∣∣f′(x10,⋯,xn0)Δx+o2(∣∣Δx∣∣)∣∣≤∣∣∣∣Δx∣∣f′(x10,⋯,xn0)Δx∣∣+∣∣∣∣Δx∣∣o2(∣∣Δx∣∣)∣∣而
∣∣Δx∣∣→0lim∣∣Δx∣∣o2(∣∣Δx∣∣)=0同时设
fij(x10,⋯,xn0)是
f的第
i个份量对第
j个变元的偏导数,则
f′(x10,⋯,xn0)Δx=⎣⎡∑i=1nf1i(x10,⋯,xn0)Δxi⋯∑i=1nfmi(x10,⋯,xn0)Δxi⎦⎤对任意的
1≤i≤m,都要
∣j−1∑nfij(x10,⋯,xn0)Δxj∣≤j=1∑nfij2(x10,⋯,xn0)
∣∣Δx∣∣所以
∣∣f′(x10,⋯,xn0)Δx∣∣≤i=1∑mj=1∑nfij2(x10,⋯,xn0)
∣∣Δx∣∣
∣∣∣∣Δx∣∣f′(x10,⋯,xn0)Δx∣∣≤i=1∑mj=1∑nfij2(x10,⋯,xn0)
所以,
∣∣∣∣Δx∣∣f′(x10,⋯,xn0)Δx+o2(∣∣Δx∣∣)∣∣局部有界,所以
∣∣Δx∣∣→0lim∣∣∣∣Δx∣∣f′(x10,⋯,xn0)Δx+o2(∣∣Δx∣∣)∣∣=0再将(2)代入(1)就能够证得结论
考虑向量函数和多元函数复合的情形:
g(y1,⋯,ym)是
m元函数,
f(x1,⋯,xn)是
n元
m维向量函数,
g在
f(x10,⋯,xn0)处可微,
f在
(x10,⋯,xn0)处可微,那么
g(f(x1,⋯,xn))在
(x10,⋯,xn0)处可微。
咱们记
h=g(f),设
f=(f1,⋯,fm),应用复合函数求导法则,就有:
∂xi∂h(x10,⋯,xn0)=j=1∑m∂xi∂fj(x10,⋯,xn0)∂yj∂g(y10,⋯,ym0)这称为多元函数求导的链式法则
高阶偏导数与高阶全微分
高阶偏导就是偏导的偏导,只不过,在高维情形下,由求偏导次序能否交换的问题。以二元函数为例,
f(x,y)的二阶偏导有四个:
∂x2∂2f表示对
x求两次偏导,
∂x∂y∂2f表示先对
x求偏导,再对
y求偏导,其余两个也能够相似写出。
问题在于
∂x∂y∂2f=∂y∂x∂2f是否成立?下面咱们证实:在高阶偏导数连续的条件下,偏导次序是能够交换的。
定理14.6
f(x,y)在
(x0,y0)的某个邻域上可求二阶偏导数,而且
∂x∂y∂2f,∂y∂x∂2f都在
(x0,y0)处连续,则
∂x∂y∂2f(x0,y0)=∂y∂x∂2f(x0,y0)
证:
首先
(x−x0)(y−y0)[f(x,y)−f(x,y0)]−[f(x0,y)−f(x0,y0)]=(x−x0)(y−y0)[f(x,y)−f(x0,y)]−[f(x,y0)−f(x0,y0)]由拉格朗日中值定理,存在
(0,1)之间的正实数
θ1和
θ2
(x−x0)(y−y0)[f(x,y)−f(x,y0)]−[f(x0,y)−f(x0,y0)]=y−y0fx(x0+θ1(x−x0),y)−fx(x0+θ1(x−x0),y0)=fxy(x0+θ1(x−x0),y0+θ2(y−y0))
h(x,y)=(x−x0)(y−y0)[f(x,y)−f(x,y0)]−[f(x0,y)−f(x0,y0)]
h(x,y)的全面极限和两个累次极限存在,相等,这样就能够证得偏导次序可交换
咱们假设二元函数在
(x0,y0)的某个邻域上各阶偏导数都存在,那么,各阶偏导数都在
(x0,y0)处连续(由于连续可微),考察函数:
h(t)=f(x0+t,y0+t),则
h(t)在
t=0处的各阶偏导数:
h(k)(0)=i=0∑kCki∂xi∂y(k−i)∂kf(x0,y0)这就和二项式定理相似,其余高阶导数的求法,大多用到数学概括法,这里再也不赘述。
方向导数
在一元状况下,导数有左导数和右导数,而在多元情形下,因为方向远远不止两个,但咱们仍是能够定义出方向导数。
方向向量就定义为
d=(d1,⋯,dn),其中
∑k=1ndk2
=1,
d就称为方向向量。方向导数就定义为极限:
∂d∂f(x)=t→0+limtf(x+td)−f(x)方向导数该如何计算呢?若是
f(x)在
f(x0)处可微,那么
f(x0+td)−f(x0)=tf′(x0)dT+o(t)这样
∂d∂f(x0)=f′(x0)dT实际上就是偏导按照方向进行加权。
高维泰勒公式
高维泰勒公式,就是
f(x0+t(x−x0))在
0处的泰勒公式,再令
t=1,高维泰勒公式形式比较复杂,在三阶以上很难写出通常的形式。不过,咱们这里给出零阶,一阶,二阶的泰勒公式的形式,在多元函数极值判断中起到重要的做用。咱们称矩阵
Hf(x0)=⎣⎢⎢⎡f11(x0)f21(x0)⋯fn1(x0)f