您的当前位置:首页正文

第四章 第四节 协方差和相关系数(数理统计课件-上海交通大学)

2020-04-06 来源:伴沃教育
Ch4-86§4.4 协方差和相关系数

问题对于二维随机变量(X ,Y ):已知联合分布边缘分布对二维随机变量,除每个随机变量各自的概率特性外, 相互之间可能还有某种联系问题是用一个怎样的数去反映这种联系.数E[XE(X)][YE(Y)]反映了随机变量X , Y 之间的某种关系Ch4-87协方差和相关系数的定义

定义称E[XE(X)][YE(Y)]为X ,Y 的协方差. 记为cov(X,Y)E[XE(X)][YE(Y)]称cov(X,Y)D(X)D(Y)cov(X,Y)为(X , Y )的协方差矩阵

可以证明协方差矩阵为半正定矩阵Ch4-88若D(X ) > 0, D(Y ) > 0 ,称(XE(X))(YE(Y)cov(X,Y)ED(X)D(Y)D(X)D(Y)为X ,Y 的相关系数,记为XYcov(X,Y)D(X)D(Y)无量纲的量事实上,XYcov(X,Y)若XY0,称X ,Y 不相关.协方差和相关系数的计算

Ch4-89cov(X,Y)E(XY)E(X)E(Y)1D(XY)D(X)D(Y)2若( X ,Y ) 为离散型,cov(X,Y)[xiE(X)][yjE(Y)]piji1j1若( X ,Y ) 为连续型,cov(X,Y)[xE(X)][yE(Y)]f(x,y)dxdyCh4-90例1已知X ,Y 的联合分布为YpijX1 0p 00q0 < p <1p + q =110求cov (X ,Y ), XY 解

X P 1 0Y P 1 0X Y P 1 0p qp qp qCh4-91E(X)p,E(Y)p,D(X)pq,D(Y)pq,E(XY)p,cov(X,Y)pq,XY1Ch4-92例2设( X ,Y ) ~ N ( 1,12;,222 ;), 求XY解cov(X,Y)(x1)(y2)f(x,y)dxdyx11y22s12122t212ste12(st)t222(1)21dsdt令stu21t(tu)e12t22(1)2u2dudtCh4-9312e22112u2(12)2dute122t2dtXY若( X ,Y ) ~ N ( 1,1则X ,Y 相互独立2, , 222, ),X ,Y 不相关Ch4-94例3设~ U(0,2) , X=cos , Y=cos( +),是给定的常数,求XY 1,0t2,解f(t)2其他1E(X)0costdt0,221E(Y)0cos(t)dt0,2211E(XY)0cos(t)cos(t)dtcos221cov(X,Y)cos22222Ch4-95111E(X)0costdt,D(X),222121122E(Y)0cos(t)dt,D(Y)2,22XYcosCh4-96若0,XY1若,XY1YXYXX,Y有线性关系|XY|13若,,0X,Y不相关,XY22但X,Y不独立,2X,Y没有线性关系,但有函数关系XY12协方差和相关系数的性质协方差的性质Ch4-97cov(X,Y)cov(Y,X)E(XY)E(X)E(Y)cov(aX,bY)abcov(X,Y)cov(XY,Z)cov(X,Z)cov(Y,Z)cov(X,X)D(X)Ch4-98|cov(X,Y)|D(X)D(Y)2当D(X ) > 0, D(Y ) > 0 时,当且仅当PYE(Y)t0[XE(X)]1时, 等式成立—Cauchy-Schwarz不等式证令g(t)E[YE(Y)]t[XE(X)]22D(Y)2tcov(X,Y)tD(X)对任何实数t ,g(t)0Ch4-994cov(X,Y)4D(X)D(Y)0即|cov(X,Y)|D(X)D(Y)等号成立g(t)0有两个相等的实零点22cov(X,Y)D(Y)t0D(X)D(X)g(t0)0即E[(YE(Y))t0(XE(X))]0显然E[(YE(Y))t0(XE(X))]02D[(YE(Y))t0(XE(X))]0Ch4-100P[(YE(Y))t0(XE(X))0]1P[(YE(Y))t0(XE(X))0]1即P[(YE(Y))t0(XE(X))]1即Y 与X 有线性关系的概率等于1, 这种线性关系为YE(Y)XE(X)P1D(X)D(Y)Ch4-101完全类似地可以证明E(XY)E(X)E(Y)22当E(X ) > 0, E(Y222) > 0 时,当且仅当P(Yt0X)1时, 等式成立.Ch4-102相关系数的性质||1XY|XY|1Cauchy-Schwarz不等式的等号成立即Y 与X 有线性关系的概率等于1,这种线性关系为PYX1X(XEX)/D(X),Y(YEY)/D(Y).Ch4-103XY1XY1cov(X,Y)0PYX1cov(X,Y)0PYX1Ch4-104如例1中X ,Y 的联合分布为pijX1 0Y10已求得p 00q0 < p <1p + q =1XY1, 则必有P(XY)1其中X(Xp)/pq,Y(Yp)/pq.Ch4-105XY0X , Y 不相关cov(X,Y)0E(XY)E(X)E(Y)D(XY)D(X)D(Y)X ,Y 相互独立X , Y 不相关若( X , Y ) 服从二维正态分布,X , Y 相互独立X , Y 不相关例4设( X ,Y ) ~ N ( 1,4; 1,4; 0.5 ), Z = X + Y , 求XZ解E(X)E(Y)1,D(X)D(Y)4,Ch4-106XY1/2,cov(X,Y)2cov(X,Z)cov(X,X)cov(X,Y)6D(Z)D(XY)D(X)D(Y)2cov(X,Y)12XZ3/123/2.Ch4-107作业P.173 习题四23 25 26 2830 ~ 32Ch4-108附录

矩在线性回归中的应用

若X , Y 是两个r.v., 用X 的线性函数去逼近Y 所产生的平均平方误差为E[Y(aXb)]2cov(X,Y)ˆ当取a,D(X)D(Y)ˆˆE(X)E(Y)XYbE(Y)aE(X)D(X)平均平方误差最小.Ch4-109附例设X ,Y 相互独立, 且都服从N ( 0, U = aX + bY , V= aX -bY , a,b 为常数,且都不为零,求UV 2),解cov(U,V)E(UV)E(U)E(V)aE(X)bE(Y)aE(X)bE(Y)aE(X)bE(Y)22由E(X)E(Y)0,E(X)E(Y)D(X)D(Y)222cov(U,V)(ab)2222222Ch4-110而D(U)aD(X)bD(Y)(ab)222222D(V)aD(X)bD(Y)(ab)故2222UVab22ab22继续a,b 取何值时,U与V 不相关?讨论此时, U与V 是否独立?Ch4-111若a = b,UV= 0, 则U , V 不相关. 但U~N(0,222a),V~N(0,222a),Ua(XY)Va(XY)11112a2afUV(u,v)||fXY(uv),(uv)112a2a2a2a1X(UV)2a1Y(UV)2aCh4-112111fUV(u,v)2fX(uv)fY(uv)2a2a2a112e22a2uv14ae22(2a)22uvuv2a2a222222(U,V)~N(0,2a;0,2a;0),且U ,V 相互独立2222

因篇幅问题不能全部显示,请点此查看更多更全内容