2197 字
11 分钟
一维随机变量及其分布

随机变量定义#

随机试验的样本空间 SS,对于 SS 中每个样本点 ee,都有唯一的实数值 X(e)X(e) 与之对应,称 X(e)X(e) 为随机变量。随机变量按取值方式可分为两类:离散型和连续型。

  • 随机变量是定义在样本空间上的实值函数, 简而言之,就是把事件和数之间建立双射。

  • 随机变量的取值与概率分布(也就和事件与概率分布)之间有双射。

累计分布函数(Cumulative Distribution Function, CDF)#

设X为一随机变量,F(x)=P(Xx),xF(x)=P(X\leq x),-\infin\leq x\leq\infin 称为X的累计分布函数简称分布函数 ,就是随机变量落在某点左边的概率。

P(a<X<b)=P(X<b)P(X<a)P(X=a)=P(xa)P(x<a)=F(a)F(a)表示左极限P(X<a)=1P(Xa)=1F(a)\begin{align*} P(a< X<b)&=P(X<b)-P(X<a)\\ P(X=a)&=P(x\leq a)-P(x<a)=F(a)-F(a^-)\text{表示左极限}\\ P(X<a)&=1-P(X\geq a)=1-F(a) \end{align*}

分布函数的性质#

  1. 0F(x)=P(Xx)10\leq F(x)=P(X\leq x)\leq 1

  2. x1x2,F(x1)F(x2),F(x)x_1\leq x_2,F(x_1)\leq F(x_2),F(x) 是单调非减的

    • 离散型随机变量的分布函数是阶梯式的,断点的横坐标对应随机变量的取值,断点的高度(y坐标之差)是随机变量的概率
    • 连续型随机变量的分布函数是光滑的
  3. F()=limxF(x)=0,F(+)=limxF(x)=1F(-\infin)=\lim_{x\to-\infin}F(x)=0,F(+\infin)=\lim_{x\to\infin}F(x)=1

  4. F(x+)=F(x)F(x^+)=F(x) ,分布函数是右连续的

    • 如果是离散型随机变量,阶梯上是左闭右开(左边实心右边空心)
    • 对于连续性随机变量,分布函数是连续的(由原函数连续),在某点处的分布函数为0,因此随机变量落在区间内不考虑端点。

eg:分布函数 F(x)=A+Barctanx,xRF(x)=A+B\arctan x,x\in R

solution

根据性质3:

{limx+F(x)=1limxF(x)=0\begin{cases} \lim_{x\to+\infin} F(x)=1\\ \lim_{x\to-\infin} F(x)=0 \end{cases}

离散型随机变量及其分布列#

定义:只取有限个值或可列无穷多个值的随机变量称为离散型随机变量

分布列:既反映每个样本点的取某值的概率

P(X=xk)=pk,k=1,2,3...P(X=x_k)=p_k,k=1,2,3...

或记作

XXx1x_1x2x_2x3x_3xnx_n
PPp1p_1p2p_2p3p_3xnx_n

离散型随机变量的分布列和分布函数之间是一一对应的。分布函数是分布列中所有不大于该数的概率之和

F(xi)=P(Xxi)=k=1,xkxiiP(X=xk)=k=1ipkF(x_i)=P(X\leq x_i)=\sum_{k=1,x_k\leq x_i}^iP(X=x_k)=\sum_{k=1}^ip_k

分布列中各随机变量的就是分布函数中跳跃点的x坐标,概率就是跳跃高度。由于分布函数的右连续性,在阶梯上的端点是左闭右开

P(X=xi)=F(xi)F(xi)P(X=x_i)=F(x_i)-F(x_i^-)

分布列的性质#

  1. pk0p_k\geq0

  2. k=1pk=1\sum_{k=1}^{\infin}p_k=1

  3. 分布列的期望:E(x)=k=1nxkpkE(x)=\sum_{k=1}^{n}x_kp_k

  4. 样本点的方差:

D(x)=1nk=1n(xkx)2k=1n(xkx)2pkD(x)=\frac{1}{n}\sum_{k=1}^{n}(x_k-\overline{x})^2\\ \Leftrightarrow\sum_{k=1}^{n}(x_k-\overline{x})^2\cdot p_k
  1. 分布列的方差(与样本点的方差区分开):推导见高中课本。
D(x)=E(X2)E2(X)D(x)=E(X^2)-E^2(X)

常见的离散型随机变量概率分布#

0-1分布/两点分布#

随机变量的取值只有0和1,其分布律为:

Px=k=pk(1p)1k,k=0,1P{x=k}=p^k\cdot (1-p)^{1-k},k=0,1
X01
PP1p1-ppp

二项分布(有放回抽样)#

分布列为

P(x=k)=(nk)pk(1p)nk,k=0,1,2,,nP(x=k)=\binom{n}{k}\,p^{k}(1-p)^{\,n-k},\qquad k=0,1,2,\ldots,n

详见二项分布那一章

泊松分布#

见二项分布

几何分布(二项分布首次成功)#

背景:假定我们有一系列伯努利试验,其中每一个的成功概率为 pp,失败概率为 1p1-p。在获得第一次成功前要进行多次试验?

分布列为

P(x=k)=p(1p)k1,k=1,2,3...P(x=k)=p(1-p)^{k-1},k=1,2,3...

推导:由几何级数的求和公式(等比求和)可以验证

k=1p(1p)k1=p1(1p)\sum_{k=1}^{\infin}p(1-p)^{k-1}=\frac{p}{1-(1-p)}

几何分布具有无记忆性:只要期待的“是”(伯努利事件首次成功)没有出现,那么几何分布就仿佛不记得之前发生的事件。值得注意的是在离散分布中只有几何分布具有此特性

P(X>m+nX>n)=P(X>m),m,n是正整数P(X=m+nX>n)=P(X=m),m,n是正整数P(X>m+n|X>n)=P(X>m),m,n\text{是正整数} P(X=m+n|X>n)=P(X=m),m,n\text{是正整数}

在这两个式子中,可以理解为 mm 次之后伯努利事件首次成功,尝试 mm 次与 n+mn+m 次的概率相同。

超几何分布(不放回找次品)#

在产品质量的不放回抽检中,若 NN 件产品中有 MM 件次品,抽检 nn 件时所得次品数 X=kX=k,此时有

P(X=k)=(Mk)(NMnk)(Nn)=CMkCNMnkCNnP(X=k)=\frac{\binom{M}{k}\,\binom{N-M}{n-k}}{\binom{N}{n}}\\ =\frac{C_M^k\,C_{N-M}^{n-k}}{C_N^n}

总体 NN 很大,抽样 nn 很小时,可以用二项分布近似超几何分布。此时次品率占主导地位,不放回的那一部分样品相比于总样品微不足道。

eg1:盒子中有a个白球b个黑球,从盒子中不放回地任取r个球,求r个球中黑球个数的分布列

设黑球个数为随机变量X,X的取值与r与白球数量的关系有关,X的可能取值 kmax{0,ra},max{0,ra}+1min{r,b}k=\max\{0,r-a\},\max\{0,r-a\}+1\dotsb \min\{r,b\}

P(X=k)=CbkCarkCa+brP(X=k)=\frac{C_b^k\,C_a^{r-k}}{C_{a+b}^r}

连续型随机变量及其概率密度#

对于非离散型的随机变量 XX,其取值不能一一列举出来,因此就不能像离散型随机变量那样使用分布列描述它。

概率密度:如果对连续型随机变量 XX累计分布函数 F(x)F(x) ,存在非负函数 f(x)f(x) ,使对于任意实数xx

F(x)=xf(t)dt,F(x)=\int_{-\infty}^xf(t)dt,

则称 XX连续型随机变量 ,其中函数 f(x)f(x) 称为 XX概率密度函数,简称概率密度

概率密度的性质#

  1. f(x)>0f(x)>0

  2. F(x)F(x) 从几何意义上看是概率密度曲线与坐标轴围成的面积, F(+)=+f(x)=1F(+\infin)=\int_{-\infin}^{+\infin}f(x)=1 和x轴围成的面积是1。

  3. 表示点落在区间的概率:P(x1<X<x2)=F(x2)F(x1)=x1x2f(t)dtP(x_1< X< x_2)=F(x_2)-F(x_1)=\int_{x_1}^{x_2}f(t)dt 。从这里可以看出连续型随机变量某一确定点的概率取值为零(曲边梯形变成一条线,面积为零),故连续型随机变量计算区间概率时,区间端点可有可无。

  4. XX 落在 xx 的邻域 (x,x+Δx)(x,x+\Delta x) 的概率约为 f(x)Δxf(x)\Delta x,近似成一个矩形的面积。

    f(x)=F(x)=limΔx0F(x+Δx)F(x)Δx=limΔx0P(x<X<x+Δx)Δxf(x)Δx=P(x<X<x+Δx)\begin{align*} f(x)=F^\prime(x&)=\lim_{\Delta x\to 0}\frac{F(x+\Delta x)-F(x)}{\Delta x}\\[5bp] &=\lim_{\Delta x\to 0}\frac{P(x<X<x+\Delta x)}{\Delta x}\\ \Leftrightarrow f(x)\cdot\Delta x&=P(x<X<x+\Delta x) \end{align*}
  5. f(x)f(x) 可积时,其原函数 F(x)F(x) 连续;当 f(x)f(x) 可积且连续时,F(x)F(x) 可导。F(x)=f(x)F^\prime(x)=f(x)

  • 1,2 是判定一个函数 f(x)f(x) 是否为概率密度函数的充要条件
  • 由 3,概率为零不是不可能事件

eg: 设随机变量 XX 的概率密度函数是 {Axex2,x>00,x0\begin{cases}Axe^{-x^2},x>0\\0,x\leq0\end{cases}AA 以及分布函数 F(x)F(x)

:::
tip[solution]
:::

+f(x)dx=1这里注意按照题目,自变量取值在支撑集内+Axex2dx=A2(ex20)=1A=2F(x)=xf(x)dx=0,x0F(x)=0xf(x)dx=0x2tet2dt=1ex2,x>0F(x)={0,x01ex2,x>0\begin{align*} &\int_{-\infin}^{+\infin}f(x)dx=1\\ &\text{这里注意按照题目,自变量取值在支撑集内}\\ &\int_{-\infin}^{+\infin}Axe^{-x^2}dx=\frac{A}{2}(-e^{-x^2}\vert_0^\infin)=1\\ &A=2\\ &F(x)=\int_{-\infin}^xf(x)dx=0,x\leq0\\ &F(x)=\int_{0}^xf(x)dx=\int_{0}^x2te^{-t^2}dt=1-e^{-x^2},x>0\\ &\therefore F(x)=\begin{cases} 0,x\leq0\\ 1-e^{-x^2},x>0 \end{cases} \end{align*}

常见的连续型随机变量概率分布#

均匀分布#

XX 具有概率密度 :

f(x)={1ba,a<x<b0 ,elsef(x) = \left\{ \begin{matrix} \begin{align*} &\frac{1}{b − a} , a < x < b\\ &0 \ , else\\ \end{align*} \end{matrix}\right.

则称 XX 在区间 (a,b)(a,b) 上服从均匀分布,记作 XU(a,b)X\sim U(a,b) 。期望 E=a+b2E=\frac{a+b}{2} ,方差 D=(ba)212D=\frac{(b-a)^2}{12}

均匀分布的分布函数:

F(x)={0x<axabaax<b1x>bF(x)=\left\{\begin{matrix} \begin{align*} &0&x<a\\ &\frac{x-a}{b-a}&a\leq x<b\\ &1&x>b \end{align*} \end{matrix} \right.
  • 均匀意思是等可能,随机变量落在 [a,b][a,b] 中长度相等的子区间 [x1,x2][x_1,x_2] 是等可能的,都是 x2x1ba\frac{x_2-x_1}{b-a}

指数分布#

XX 具有概率密度:

f(x)={λeλxx>00x0λ>0f(x)=\left\{\begin{matrix} \begin{align*} &\lambda e^{-\lambda x} &x>0\\ &0 &x\leq0 \end{align*} &&\lambda>0 \end{matrix}\right.

则称 XX 服从参数为 λ\lambda 的指数分布,记作 XE(λ)X\sim E(\lambda) ,期望 E=1λE=\frac{1}{\lambda} ,方差 D=1λ2D=\frac{1}{\lambda^2}

指数分布的分布函数:

F(x)={1eλxx>00x0λ>0F(x)=\left\{\begin{matrix} \begin{align*} &1-e^{-\lambda x} &x>0\\ &0 &x\leq0 \end{align*} &&\lambda>0 \end{matrix}\right.
  • 指数分布常用来描述寿命,比如说持续无故障的工作时间,平均寿命就是参数 λ\lambda
  • 指数分布的无记忆: P(x>t+sx>s)=P(x>t)P(x>t+s|x>s)=P(x>t) ,已工作8小时再无故障工作10小时的概率=工作十小时无故障的概率

正态分布#

若连续型随机变量 XX 具有概率密度

f(x)=1σ2πe(xμ)22σ2,σ>0,<x<.f(x)=\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}} ,\sigma>0,-\infin<x<\infin.

​ 则称 XX 服从参数为 μ,σ\mu,\sigma 的正态分布,记作 XN(μ,σ2)X\sim N(\mu,\sigma^2) ,期望 E=μE=\mu ,方差 D=σ2D=\sigma^2

1σ2πe(xμ)22σ2dx=1换元t=xμσ1σ2πe(xμ)22σ2dx=12πet22dt剩下证法参考微积分\int_{-\infin}^{\infin}\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}dx=1\\[10bp] \text{换元}t=\frac{x-\mu}{\sigma}\\[10bp] \int_{-\infin}^{\infin}\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}dx=\frac{1}{\sqrt{2\pi}}\int_{-\infin}^{\infin}e^{-\frac{t^2}{2}}dt\\[10bp] \text{剩下证法参考微积分}

正态分布的密度函数曲线性质:

  • x=μx=\mu 是对称轴, μ\mu 决定对称轴的位置,也被称为位置参数

  • x=μx=\mu 时, f(x)max=1σ2π,σf(x)_{max}=\frac{1}{\sigma \sqrt{2\pi}},\sigma决定离散程度,σ\sigma 越大,最大值越小,图形越矮胖。

  • x±,f(x)0x\to\pm\infin,f(x)\to 0

  • 两个拐点:μ±σ\mu\pm\sigma

正态分布的分布函数:

F(x)=1σ2πxe(tμ)22σ2dtF(x)=\frac{1}{\sigma\sqrt{2\pi}}\int_{-\infin}^{x}e^{-\frac{(t-\mu)^2}{2\sigma^2}}dt

正态分布的分布函数曲线性质:

  • 由于密度函数关于x=μx=\mu对称,故对称轴左右两边与x轴围成面积各0.5,故 F(μ)=1/2F(\mu)=1/2
  • x,F(x)1,x,f(x)0x\to\infin,F(x)\to1,x\to-\infin,f(x)\to0

标准正态分布#

若连续性随机变量 XN(μ=0,σ2=1)X\sim N(\mu=0,\sigma^2=1) ,则称 XX 服从标准正态分布。

标准正态分布的概率密度:ϕ(x)=12πex22\phi(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}},对称轴是 x=0x=0,偶函数

标准正态分布的分布函数:Φ(x)=12πxet22dt\Phi(x)=\frac{1}{\sqrt{2\pi}}\int_{-\infin}^{x}e^{-\frac{t^2}{2}}dt,对称中心是(00.5)(0,0.5)Φ(x)+Φ(x)=1\Phi(x)+\Phi(-x)=1

一般的正态分布 N(μ,σ2)N(\mu,\sigma^2) 与标准正态分布的分布函数之间满足如下关系:

F(x)=Φ(xμσ)XN(μ,σ2)XμσN(0,1)F(x)=\Phi(\frac{x-\mu}{\sigma})\\ X\sim N(\mu,\sigma^2)\Leftrightarrow\frac{X-\mu}{\sigma}\sim N(0,1)\\[10bp]

一般正态分布的分布函数有如下变形

P(x1<X<x2)=F(x2)F(x1)=x1x2f(t)dt=Φ(x1μσ)Φ(x2μσ)P(x_1< X< x_2)=F(x_2)-F(x_1)=\int_{x_1}^{x_2}f(t)dt\\ =\Phi(\frac{x_1-\mu}{\sigma})-\Phi(\frac{x_2-\mu}{\sigma})

推导:

F(x)=1σ2πxe(tμ)22σ2dt换元,令 v=tμσF(x)=12πxμσev22dvΦ(x)=12πxet22dtxxμσ\begin{align*} F(x)&=\frac{1}{\sigma\sqrt{2\pi}}\int_{-\infin}^{x}e^{-\frac{(t-\mu)^2}{2\sigma^2}}dt\\ \text{换元,令 }v&=\frac{t-\mu}{\sigma}\\ F(x)&=\frac{1}{\sqrt{2\pi}}\int_{-\infin}^{\frac{x-\mu}{\sigma}}e^{-\frac{v^2}{2}}dv\\ \Phi(x)&=\frac{1}{\sqrt{2\pi}}\int_{-\infin}^{x}e^{-\frac{t^2}{2}}dt\\ x&\to \frac{x-\mu}{\sigma} \end{align*}\\
一维随机变量及其分布
https://biscuit0613.github.io/posts/possibilitytheory/pt_1drandomvardistri/
作者
biscuit
发布于
2025-08-20
许可协议
CC BY-NC-SA 4.0