Chapter 4 随机变量的数字特征¶
约 536 个字 7 张图片 预计阅读时间 3 分钟
数学期望¶
数学期望简称期望,又称均值。
- 离散型随机变量:\(E(X) = \sum\limits_{k=1}^{+\infty}x_kp_k\),且要求\(\sum\limits_{k=1}^{+\infty}|x_k|p_k < \infty\)
- 连续型随机变量:\(E(X) = \int_{-\infty}^{+\infty} xf(x)dx\),且要求\(\int_{-\infty}^{+\infty}|x|f(x)dx< \infty\)
- 随机变量函数的数学期望:设 \(Y\) 是随机变量 \(X\) 的函数:\(Y=g(X)\)(\(g\) 是连续函数)。
- \(X\) 是离散型随机变量,它的分布律为 \(P(X=x_k)=p_k,k=1,2,\dots\),若 \(\sum\limits_{k=1}^{+\infty}g(x_k)p_k\) 绝对收敛,则有:\(E(Y)=E(g(X))=\sum\limits_{k=1}^{+\infty}g(x_k)p_k\)。
- \(X\) 是连续型随机变量,它的概率密度为 \(f(x)\),若 \(\int_{−\infty}^{+\infty}g(x)f(x)dx\) 绝对收敛,则有:\(E(Y)=E(g(X))=\int_{−\infty}^{+\infty}g(x)f(x)dx\)。
性质¶
-
\(C\) 是常数,则有 \(E(C)=C\)
-
设 \(X\) 是随机变量,\(C\)是常数,\(E(CX)=CE(X)\)
-
设 \(X,Y\) 是两个随机变量,\(E(X+Y) = E(X) + E(Y)\)
-
这一性质可以推广到任意有限个随机变量线性组合的情况:
\(E(c_o + \sum\limits_{i=1}^nc_iX_i) = c_o + \sum\limits_{i=1}^nc_iE(X_i)\)
-
这是期望的线性性质,无需独立。
-
-
设 \(X,Y\) 是相互独立的随机变量,则 \(E(X \cdot Y)=E(X) \cdot E(Y)\),但逆命题不成立;
-
这一性质可以推广到任意有限个相互独立的随机变量:
\(E(\prod\limits_{i=1}^nX_i) = \prod\limits_{i=1}^nE(X_i)\)
-
Question
计算机程序随机产生0 ~ 9中的数字. 记\(X_i\)为第\(i\)次产生的数字,\(i=1, 2,\dots ,n\). 将这\(n\)个数依次排列,得到一数,记为\(Y\),求\(E(Y)\).
Question
一专用电梯载着12位乘客从一层上升,最高11层.假设中途没有乘客进入,每位乘客独立等概率地到达各层.如果没有乘客到达某层楼,电梯在该层就不停.记电梯停留次数为X,求E(X). (设电梯到达11层后乘客全部下完)
方差¶
X的方差:
X的标准差或均方差:
而其计算方法可以利用随机变量函数的数学期望,记 \(g(X)=(X−E(X))^2\) ,然后计算 \(E(g(X))\)。
- 离散型:\(Var(X)=E{[X−E(X)]^2}=\sum\limits_{i=1}^{+\infty}[x_i−E(X)]^2p_i;\)
- 连续型:\(Var(X)=E{[X−E(X)]^2}=\int_{−\infty}^{+\infty}[x−E(X)]^2f(x)dx;\)
- 利用期望的性质,可以得到 \(Var(X)=E(X^2)−E^2(X)\);
性质¶
-
若 \(C\) 是常数,则 \(Var(C)=0\);
-
设 \(X\) 是随机变量,\(C\) 是常数,则 \(Var(C \cdot X)= C^2\cdot Var(X)\);
-
设\(X,Y\) 是两个随机变量,则
- 这一性质可以推广到任意有限个随机变量之和的情况:
-
特别地,如果 \(X,Y\) 相互独立,则 \(Var(X \pm Y)=Var(X)+Var(Y)\);
-
进一步地,如果 \(X_i(i=1,2,\dots,n)\) 彼此独立,则\(Var(c_0+\sum\limits_{i=1}^nc_iX_i)=\sum\limits_{i=1}^nc_i^2Var(X_i);\)
-
\(Var(X)\le E[(X−c)^2]\),并且当且仅当 \(E(X)=c\) 时等号成立;
-
\(Var(X)=0 \Leftrightarrow P(X=c)=1\) and \(c=E(X);\)
Question
设\(X \sim N(22.40,0.03^2),Y \sim N(22.50,0.04^2)\),且 \(X\) 和 \(Y\) 相互独立,计算 \(P(X < Y)\)
常见分布的数学期望与方差¶
协方差与相关系数¶
随机变量 \(X,Y\) 的协方差 \(Cov(X,Y)=E{[X−E(X)][Y−E(Y)]}=E(XY)−E(X)E(Y)\)
协方差的性质¶
- \(Cov(X,Y)=Cov(Y,X)\);
- \(Cov(X,Y)=E(XY)−E(X)E(Y)\);
- \(Cov(aX,bY)=ab*Cov(X,Y) \ ,a,b \in R\);
- \(Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z)\);
- \(Cov(X,X)=Var(X)\);
- \(Cov(c,Y)=E(cY)−E(c)E(Y)=0,c \in R;\)
- \(Cov(X+Y,X−Y)=Cov(X,X)−Cov(Y,Y);\)
- \(Cov(X^∗,Y^∗)=Cov(\frac{X−E(X)}{\sqrt{Var(X)}},\frac{Y−E(Y)}{\sqrt{Var(Y)}})=\frac{Cov(X,Y)}{\sqrt{Var(X)Var(Y)}}=\rho_{XY};\)
- \(Cov(aX+bY,cX+dY)=ac \cdot Var(X)+bd \cdot Var(Y)+(ad+bc)Cov(X,Y);\)
- \(Cov(\sum\limits_{i}a_iX_i,Y) = \sum\limits_{i}a_iCov(X_i,Y);\)
随机变量 \(X,Y\) 的相关系数 \(\rho_{XY}= \frac{Cov(X,Y)}{\sqrt{Var(X)Var(Y)}}\)
相关系数的性质¶
-
\(∣\rho_{XY}∣\le 1\) ;
-
\(∣\rho_{XY}∣=1 \Leftrightarrow \exists a,b \in R,\ s.t.\ P(Y=a+bX)=1\) ;
- \(\rho_{XY}=+1\)时,\(b>0\) ;
- \(\rho_{XY}=-1\)时,\(b<0\) ;
- 上述两条性质可以合并写成: 当 \(Var(X)Var(Y) \neq 0\) 时,有 \(Cov^2(X,Y) \le Var(X)Var(Y)\) ,其中等号当且仅当 \(X\) 与 \(Y\) 之间有严格的线性关系,即存在常数 \(a,b\) ,使 \(P(Y=a+bX)=1\) ;
相关系数 \(\rho_{XY}\) 是用来表征 \(X,Y\) 之间线性关系紧密程度的量。
此外,考虑以 \(X\) 的线性函数 \(a+bX\) 来近似表示 \(Y\),均方误差 \(e(a,b)=E{[Y−(a+bX)]^2}\) 也可以用来衡量 \(X,Y\) 之间线性关系紧密程度。其中有:
-
\(∣\rho_{XY}∣\)比较大时,均方误差较小,表示 \(X,Y\) 线性关系的程度好;
-
\(∣\rho_{XY}∣=1\) 时,均方误差为 0,表示 \(X,Y\) 之间以概率 1 存在线性关系;
-
\(∣\rho_{XY}∣\) 比较小时,均方误差较大,表明 \(X,Y\) 线性关系的程度差;
-
\(\rho_{XY}>0\)时,\(X,Y\) 正相关;
-
\(\rho_{XY}<0\)时,\(X,Y\) 负相关;
-
\(\rho_{XY}=0\) 时,称 \(X,Y\) 不相关或零相关(仅仅对于线性关系来说,与独立的含义不同);
- \(\rho_{XY}=0\) 有如下等价条件:
- \(Cov(X,Y)=0\);
- \(E(XY)=E(X)E(Y)\);
- \(Var(X \pm Y)=Var(X)+Var(Y)\);
- \(\rho_{XY}=0\) 有如下等价条件:
特别地:
若 \((X,Y)\) 服从二元正态分布,记为 \((X,Y) \sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)\)
性质:
- \(X \sim N(\mu_1,\sigma_1^2)\) , \(Y \sim N(\mu_2,\sigma_2^2)\)
- \(X\) 和 \(Y\) 的相关系数 \(\rho_{XY} = \rho\)
- X与Y相互独立 \(\Leftrightarrow \rho = 0 \Leftrightarrow\) X与Y不相关
注意区分独立性和相关性:
- \(X,Y\) 互相独立 \(\Rightarrow X,Y\) 不相关;
- \(X,Y\) 不独立 \(\Leftarrow X,Y\) 相关;
- 在联合正态的情况下,独立与不相关是等价的;
其他数字特征¶
- X的k阶(原点)矩:\(E(X^k)\)
- X的k阶中心矩:\(E\{[X-E(X)]^k\}\)
- X和Y的k+l阶混合(原点)矩:\(E\{X^kY^l\}\)
- X,Y的k+l阶混合中心矩:\(E\{[X-E(X)]^k[Y-E(Y)]^l\}\)
- \(x_\alpha\)为随机变量X的上(侧)\(\alpha\)分位数:\(P\{X > x_\alpha \} = 1 - F(x_{\alpha}) = \int_{x_{\alpha}}^{+\infty}f(x)dx = \alpha\)
n元随机变量X的数学期望(向量):
协方差矩阵:
n元正态变量具有以下四条重要性质¶
- \(n\)维正态变量\((X_1,X_2,...,X_n)^T\)中的任意子向量 \((X_{i_1},X_{i_2},\dots,X_{i_k})^T , \ 1 \le k \le n\)也服从\(k\)元正态分布;
- 特别地,每一个分量 \(X_i,\ i=1,2,\dots ,n\)都是正态变量;
- 反之,若每个 \(X_i\) 都是正态变量,且相互独立,则$ (X_1,X_2, \dots,X_n)$是 \(n\)维正态变量;
-
\(n\) 维随机变量 \((X_1,X_2,\dots ,X_n)\) 服从 \(n\) 维正态分布的充要条件是 \(X_1,X_2,\dots ,X_n\) 的任意线性组合 \(\sum\limits_{i=1}^nl_iX_i\) 服从一维正态分布,其中 \(l_1,l_2,\dots ,l_n\)不全为 \(0\);
-
若 \((X_1,X_2,\dots ,X_n)\) 服从 \(n\) 维正态分布,设 \(Y_1,Y_2,\dots ,Y_k\) 是 \(X_i\) 的线性函数,则 \((Y_1,Y_2,\dots,Y_k)\) 也服从多维正态分布,这一性质被称为正态变量的线性变换不变性;
-
若 \((X_1,X_2,\dots ,X_n)\) 服从 \(n\) 维正态分布,则 \(X_1,X_2,\dots ,X_n\) 互相独立的充要条件是 \(X_i\) 两两不相关,也等价于协方差矩阵为对角矩阵;
Question
设二元随机变量\((X,Y)\)服从二元正态分布,\(X∼N(0,1),Y∼N(1,4)\),X与Y的相关系数\(\rho = -\frac{1}{2}\)求:
(1)\(Var(2X-Y)\);
(2)\(P(2X > Y)\);
(3) \(Z_1 = X + Y,Z_2 = X - Y\),求\((Z_1,Z_2)\)的分布。