随机变量定义#
随机试验的样本空间 S,对于 S 中每个样本点 e,都有唯一的实数值 X(e) 与之对应,称 X(e) 为随机变量。随机变量按取值方式可分为两类:离散型和连续型。
累计分布函数(Cumulative Distribution Function, CDF)#
设X为一随机变量,F(x)=P(X≤x),−∞≤x≤∞ 称为X的累计分布函数简称分布函数
,就是随机变量落在某点左边的概率。
P(a<X<b)P(X=a)P(X<a)=P(X<b)−P(X<a)=P(x≤a)−P(x<a)=F(a)−F(a−)表示左极限=1−P(X≥a)=1−F(a)分布函数的性质#
-
0≤F(x)=P(X≤x)≤1
-
x1≤x2,F(x1)≤F(x2),F(x) 是单调非减的
- 离散型随机变量的分布函数是阶梯式的,断点的横坐标对应随机变量的取值,断点的高度(y坐标之差)是随机变量的概率
- 连续型随机变量的分布函数是光滑的
-
F(−∞)=limx→−∞F(x)=0,F(+∞)=limx→∞F(x)=1
-
F(x+)=F(x) ,分布函数是右连续的
- 如果是离散型随机变量,阶梯上是左闭右开(左边实心右边空心)
- 对于连续性随机变量,分布函数是连续的(由原函数连续),在某点处的分布函数为0,因此随机变量落在区间内不考虑端点。
eg:分布函数 F(x)=A+Barctanx,x∈R
solution
根据性质3:
{limx→+∞F(x)=1limx→−∞F(x)=0
离散型随机变量及其分布列#
定义:只取有限个值或可列无穷多个值的随机变量称为离散型随机变量
分布列:既反映每个样本点的取某值的概率
P(X=xk)=pk,k=1,2,3...或记作
| X | x1 | x2 | x3 | … | xn |
|---|
| P | p1 | p2 | p3 | … | xn |
离散型随机变量的分布列和分布函数之间是一一对应的。分布函数是分布列中所有不大于该数的概率之和
F(xi)=P(X≤xi)=k=1,xk≤xi∑iP(X=xk)=k=1∑ipk分布列中各随机变量的值就是分布函数中跳跃点的x坐标,概率就是跳跃高度。由于分布函数的右连续性,在阶梯上的端点是左闭右开:
P(X=xi)=F(xi)−F(xi−)分布列的性质#
-
pk≥0
-
∑k=1∞pk=1
-
分布列的期望:E(x)=∑k=1nxkpk
-
样本点的方差:
D(x)=n1k=1∑n(xk−x)2⇔k=1∑n(xk−x)2⋅pk
- 分布列的方差(与样本点的方差区分开):推导见高中课本。
D(x)=E(X2)−E2(X)
常见的离散型随机变量概率分布#
0-1分布/两点分布#
随机变量的取值只有0和1,其分布律为:
Px=k=pk⋅(1−p)1−k,k=0,1
二项分布(有放回抽样)#
分布列为
P(x=k)=(kn)pk(1−p)n−k,k=0,1,2,…,n详见二项分布那一章
几何分布(二项分布首次成功)#
背景:假定我们有一系列伯努利试验,其中每一个的成功概率为 p,失败概率为 1−p。在获得第一次成功前要进行多次试验?
分布列为
P(x=k)=p(1−p)k−1,k=1,2,3...推导:由几何级数的求和公式(等比求和)可以验证
k=1∑∞p(1−p)k−1=1−(1−p)p几何分布具有无记忆性:只要期待的“是”(伯努利事件首次成功)没有出现,那么几何分布就仿佛不记得之前发生的事件。值得注意的是在离散分布中只有几何分布具有此特性
P(X>m+n∣X>n)=P(X>m),m,n是正整数P(X=m+n∣X>n)=P(X=m),m,n是正整数在这两个式子中,可以理解为 m 次之后伯努利事件首次成功,尝试 m 次与 n+m 次的概率相同。
超几何分布(不放回找次品)#
在产品质量的不放回抽检中,若 N 件产品中有 M 件次品,抽检 n 件时所得次品数 X=k,此时有
P(X=k)=(nN)(kM)(n−kN−M)=CNnCMkCN−Mn−k总体 N 很大,抽样 n 很小时,可以用二项分布近似超几何分布。此时次品率占主导地位,不放回的那一部分样品相比于总样品微不足道。
eg1:盒子中有a个白球b个黑球,从盒子中不放回地任取r个球,求r个球中黑球个数的分布列
设黑球个数为随机变量X,X的取值与r与白球数量的关系有关,X的可能取值 k=max{0,r−a},max{0,r−a}+1⋯min{r,b}
P(X=k)=Ca+brCbkCar−k
连续型随机变量及其概率密度#
对于非离散型的随机变量 X,其取值不能一一列举出来,因此就不能像离散型随机变量那样使用分布列描述它。
概率密度:如果对连续型随机变量 X 的累计分布函数 F(x) ,存在非负函数 f(x) ,使对于任意实数x有
F(x)=∫−∞xf(t)dt,则称 X 为连续型随机变量 ,其中函数 f(x) 称为 X 的概率密度函数,简称概率密度。
概率密度的性质#
-
f(x)>0
-
F(x) 从几何意义上看是概率密度曲线与坐标轴围成的面积, F(+∞)=∫−∞+∞f(x)=1 和x轴围成的面积是1。
-
表示点落在区间的概率:P(x1<X<x2)=F(x2)−F(x1)=∫x1x2f(t)dt 。从这里可以看出连续型随机变量在某一确定点的概率取值为零(曲边梯形变成一条线,面积为零),故连续型随机变量计算区间概率时,区间端点可有可无。
-
X 落在 x 的邻域 (x,x+Δx) 的概率约为 f(x)Δx,近似成一个矩形的面积。
f(x)=F′(x⇔f(x)⋅Δx)=Δx→0limΔxF(x+Δx)−F(x)=Δx→0limΔxP(x<X<x+Δx)=P(x<X<x+Δx)
-
当 f(x) 可积时,其原函数 F(x) 连续;当 f(x) 可积且连续时,F(x) 可导。F′(x)=f(x)
- 1,2 是判定一个函数 f(x) 是否为概率密度函数的充要条件
- 由 3,概率为零不是不可能事件
eg: 设随机变量 X 的概率密度函数是 {Axe−x2,x>00,x≤0 求 A 以及分布函数 F(x)
:::
tip[solution]
:::
∫−∞+∞f(x)dx=1这里注意按照题目,自变量取值在支撑集内∫−∞+∞Axe−x2dx=2A(−e−x2∣0∞)=1A=2F(x)=∫−∞xf(x)dx=0,x≤0F(x)=∫0xf(x)dx=∫0x2te−t2dt=1−e−x2,x>0∴F(x)={0,x≤01−e−x2,x>0
常见的连续型随机变量概率分布#
均匀分布#
若 X 具有概率密度 :
f(x)=⎩⎨⎧b−a1,a<x<b0 ,else则称 X 在区间 (a,b) 上服从均匀分布,记作 X∼U(a,b) 。期望 E=2a+b ,方差 D=12(b−a)2
均匀分布的分布函数:
F(x)=⎩⎨⎧0b−ax−a1x<aa≤x<bx>b
- 均匀意思是等可能,随机变量落在 [a,b] 中长度相等的子区间 [x1,x2] 是等可能的,都是 b−ax2−x1
指数分布#
若 X 具有概率密度:
f(x)={λe−λx0x>0x≤0λ>0则称 X 服从参数为 λ 的指数分布,记作 X∼E(λ) ,期望 E=λ1 ,方差 D=λ21
指数分布的分布函数:
F(x)={1−e−λx0x>0x≤0λ>0
- 指数分布常用来描述寿命,比如说持续无故障的工作时间,平均寿命就是参数 λ
- 指数分布的无记忆: P(x>t+s∣x>s)=P(x>t) ,已工作8小时再无故障工作10小时的概率=工作十小时无故障的概率
正态分布#
若连续型随机变量 X 具有概率密度
f(x)=σ2π1e−2σ2(x−μ)2,σ>0,−∞<x<∞.
则称 X 服从参数为 μ,σ 的正态分布,记作 X∼N(μ,σ2) ,期望 E=μ ,方差 D=σ2
∫−∞∞σ2π1e−2σ2(x−μ)2dx=1换元t=σx−μ∫−∞∞σ2π1e−2σ2(x−μ)2dx=2π1∫−∞∞e−2t2dt剩下证法参考微积分正态分布的密度函数曲线性质:
-
x=μ 是对称轴, μ 决定对称轴的位置,也被称为位置参数
-
当 x=μ 时, f(x)max=σ2π1,σ决定离散程度,σ 越大,最大值越小,图形越矮胖。
-
x→±∞,f(x)→0
-
两个拐点:μ±σ
正态分布的分布函数:
F(x)=σ2π1∫−∞xe−2σ2(t−μ)2dt正态分布的分布函数曲线性质:
- 由于密度函数关于x=μ对称,故对称轴左右两边与x轴围成面积各0.5,故 F(μ)=1/2
- x→∞,F(x)→1,x→−∞,f(x)→0
标准正态分布#
若连续性随机变量 X∼N(μ=0,σ2=1) ,则称 X 服从标准正态分布。
标准正态分布的概率密度:ϕ(x)=2π1e−2x2,对称轴是 x=0,偶函数
标准正态分布的分布函数:Φ(x)=2π1∫−∞xe−2t2dt,对称中心是(0,0.5), Φ(x)+Φ(−x)=1
一般的正态分布 N(μ,σ2) 与标准正态分布的分布函数之间满足如下关系:
F(x)=Φ(σx−μ)X∼N(μ,σ2)⇔σX−μ∼N(0,1)一般正态分布的分布函数有如下变形
P(x1<X<x2)=F(x2)−F(x1)=∫x1x2f(t)dt=Φ(σx1−μ)−Φ(σx2−μ)推导:
F(x)换元,令 vF(x)Φ(x)x=σ2π1∫−∞xe−2σ2(t−μ)2dt=σt−μ=2π1∫−∞σx−μe−2v2dv=2π1∫−∞xe−2t2dt→σx−μ