随机变量及其分布
目录
1 随机变量 2
2 离散型随机变量的分布 2
2.1 0-1 分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.2 离散均匀分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.3 二项分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.4 几何分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.4.1 几何分布的无记忆性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.5 超几何分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.6 Pascal 分布 (负二项分布) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.7 Poisson 分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3 连续型随机变量及其分布 4
3.1 连续型随机变量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.2 正态分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.3 指数分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.3.1 寿命近似与失效率函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.3.2 指数分布的无记忆性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1
1 随机变量
希望将事件一一映射为实数, 这个映射就称为随机变量. 直观上随机变量是取值随试验结果而定且有一定
概率分布的变量, 从数学角度上可以严格定义随机变量.
2 离散型随机变量的分布
取值只能为可列个的随机变量称为离散型随机变量. 𝑋 取的一切可能值为 𝑥
1
, 𝑥
2
, ..., 𝑥
𝑛
,
𝑃(𝑋 = 𝑥
𝑘
) = 𝑝
𝑘
称为 𝑋 分布律概率质量函数. 其中
𝑝
𝑘
0,
𝑝
𝑘
= 1
2.1 0-1 分布
随机变量 𝑋 的分布律为 其中 0 < 𝑝 < 1, 则称 𝑋 服从 0-1 分布伯努利分布两点分布.0-1 分布随机变
𝑋 0 1
𝑃 1 𝑝 𝑝
𝑋 的分布函数也可以写为
𝑃(𝑋 = 𝑥) = 𝑝
𝑥
(1 𝑝)
1𝑥
, 𝑥 = 01
2.2 离散均匀分布
若随机变量 𝑋 的分布律为
𝑃(𝑋 = 𝑥
𝑘
) =
1
𝑛
其中 𝑥
𝑘
𝑘 个不同的实数, 则称随机变量 𝑋 服从离散均匀分布. 古典概型就是离散均匀分布.
2.3 二项分布
如高中的二项分布. 设离散型随机变量 𝑋 的所有可能取值为 {0, 1, ..., 𝑛}, 0 < 𝑝 < 1, 如果其分布律为
𝑃(𝑋 = 𝑘) =
𝑛
𝑘
𝑝
𝑘
(1 𝑝)
𝑛𝑘
则称 𝑋 服从二项分布, 记为 𝑋 𝐵(𝑛, 𝑝),𝑃(𝑋 = 𝑘)c
排列组合略
2.4 几何分布
𝑛 重贝努里实验中, 当试验次数 𝑛 , 称为可列重贝努里试验
𝑋 表示 𝐴 出现, 即若“成功” 𝐴 发生,𝑝 =
𝑃(𝐴) = 1 𝑞, 𝑋 表示首次成功时的试验次数,
𝑃(𝑋 = 𝑘) = 𝑞
𝑘1
𝑝, 𝑘 = 1, 2, ···
𝑋 服从几何分布, 记为
𝑋
𝐺
(
𝑝
)
2.4.1 几何分布的无记忆性
几何分布具有无记忆性是指若有 𝜉 𝐺 (𝑝) 则对 𝑚, 𝑛 > 0, 都有
𝑃(𝜉 > 𝑚 + 𝑛|𝜉 > 𝑚) = 𝑃(𝜉 > 𝑛)
显然成立, 下证
𝑚 = 0, 得到
𝑃(𝑋 > 0) = 1
由条件概率
𝑃(𝜉 > 𝑚 + 𝑛|𝜉 > 𝑚) =
𝑃(𝜉 > 𝑚 + 𝑛 𝜉 > 𝑚)
𝑃(𝑥𝑖 > 𝑚)
=
𝑃(𝜉 > 𝑚 + 𝑛)
𝑃(𝜉 > 𝑚)
𝑚 = 1 得到
𝑃(𝜉 > 𝑛 + 1) = 𝑃(𝜉 = 1)𝑃(𝜉 = 𝑛)
因此
𝑃(𝜉 > 𝑛) = 𝑃(𝜉 > 1)
𝑛1
𝜉 服从几何分布
2.5 超几何分布
𝑁 个产品中有 𝑀 个次品, 不放回抽取 𝑛 , 则其中有 𝑚 个次品的概率为
𝑝 =
𝑀
𝑛
𝑁 𝑀
𝑛𝑚
𝑁
𝑛
2.6 Pascal 分布 (负二项分布)
在可列重贝努里试验中, 若以 𝑋
𝑟
表示第 𝑟 次成功发生时的试验次数, 则有
𝑃(𝑋
𝑟
= 𝑘) = 𝑃({𝑘 1次恰有𝑟 1次成功且第𝑘次成功})
于是就能得到 𝑋
𝑟
的分布律为
𝑃(𝑋
𝑟
= 𝑘) =
𝑘1
𝑘1
𝑝
𝑟
𝑞
𝑘𝑟
, 𝑘 = 𝑟, 𝑟 + 1, ···
称此概率分布为 Pascal 分布
2.7 Poisson 分布
𝑛 重贝努里实验中, 𝑝
𝑛
代表事件 𝐴 在试验中出现的概率, 它与实验总数 𝑛 有关. 𝑛𝑝
𝑚
𝜆, 则当
𝑛 +𝑖𝑛 𝑓 𝑡𝑦 时有
𝑛
𝑘
𝑝
𝑘
𝑛
(1 𝑝
𝑛
)
𝑛𝑘
𝜆
𝑘
𝑘!
𝑒
𝜆
𝑋 的概率分布为
𝑃(𝑋 = 𝑘) =
𝜆
𝑘
𝑘!
𝑒
𝜆
, 𝑘 = 0, 1, 2, ·· · 𝜆 > 0
则称 𝑋 服从参数为 𝜆 Poisson 分布, 记为
𝑋 𝑃(𝜆)
考虑情形: 假定体积为 𝑉 的液体包含有一个大数目 𝑁 的微生物. 再假定微生物没有群居的本能, 它们能够
在液体的任何部分出现, 且在体积相等的部分出现的机会相同. 现在我们取体积为 𝐷 << 𝑉 的微量液体在
显微镜下观察, 问在这微量液体中将发现 𝑥 个微生物的概率是什么
由二项分布就可以得到概率
𝑁
𝑥
𝐷
𝑉
𝑥
1
𝐷
𝑉
𝑁 𝑥
𝑁
𝑉
= 𝑑 就可以将原式化为
𝑁 (𝑁 1)(𝑁 2) ··· (𝑁 𝑥 + 1)
𝑥!𝑁
𝑥
𝑁 𝐷
𝑉
𝑥
1
𝑁 𝐷
𝑁𝑉
𝑁 𝑥
也即
(1
1
𝑁
)(1
2
𝑁
) ···(1
𝑥1
𝑁
)(𝐷𝑑)
𝑥
(1
𝐷𝑑
𝑁
)
𝑁 𝑥
𝑥!
再令 𝑉 , 𝑁 得到
𝑒
𝐷𝑑
(𝐷𝑑)
𝑥
𝑥!
𝐷𝑑 = 𝜆 就得到了泊松分布
3 连续型随机变量及其分布
3.1 连续型随机变量
𝑋 称为连续型随机变量, 如果存在一个函数 𝑓 , 叫做 𝑋 的概率密度函数, 它满足下面的条件
1. 对所有的 −∞ < 𝑥 < +∞, 𝑓 (𝑥) 0
2.
+∞
𝑓 (𝑥)𝑑𝑥 = 1
3. 对任意 −∞ < 𝑎 𝑏 < +∞. 𝑃(𝑎 𝑋 𝑏) =
𝑏
𝑎
𝑓 (𝑥)𝑑𝑥
𝑓 只取有限区间 [𝑎, 𝑏] 的值,
˜
𝑓 (𝑥) =
𝑓 (𝑥) 𝑥 [𝑎, 𝑏]
0 其它
˜
𝑓 是定义在 (−∞, +∞) 上的密度函数, 𝑓 (𝑥)
˜
𝑓 (𝑥) 给出相同的概率分布
定义
𝐹 (𝑥) =
𝑥
𝑓 (𝑢)𝑑𝑢, < 𝑥 < +∞
称为 𝑋 (累积) 分布函数, 表示的是 𝑋 的数值小于等于 𝑥 的概率,
𝐹 (𝑥) = 𝑃(𝑋 𝑥) < 𝑥 < +∞
𝐹 (𝑥) 具有如下性质
1. 𝐹 是单调非减的函数
2. 0 𝐹 (𝑥) 1, 𝑥 𝑅, lim
𝑥→+∞
𝐹 (𝑥) = 0, lim
𝑥→+∞
𝐹 (𝑥) = 1
3. 𝐹
(
𝑥
)
右连续
4. 𝐹(𝑥) 𝑥 点导数存在, 𝐹
(𝑥) = 𝑓 (𝑥)
3.2 正态分布
若一个随机变量 𝑋 具有概率密度函数
𝑓 (𝑥) =
1
2𝜋𝜎
𝑒
(𝑥 𝜇 )
2
2 𝜎
2
, < 𝑥 < +∞
则称 𝑋 为一正态随机变量, 记为
𝑋 𝑁 (𝜇, 𝜎
2
)
𝑌 =
𝑥
+
𝜇
𝜎
则由于
𝑓
𝑦
(𝑦)𝑑𝑦 =
𝑓 (𝑥)𝑑𝑥 +𝐶
得到 𝑌 的概率密度函数为
𝑓 (𝑦) =
1
2𝜋
𝑒
𝑦
2
2
具有参数 𝜇 = 0, 𝜎 = 1 的正态分布称为标准正态分布, Φ(𝑥), 𝜙(𝑥) 表示标准正态分布 𝑁 (0, 1) 的分布函
数和密度函数.
若以 𝐹(𝑥) 记为正态分布 𝑁 (𝜇, 𝜎
2
) 的概率分布函数, 则有
𝐹 (𝑥) = Φ(
𝑥 𝜇
𝜎
)
因而任意正态分布的概率密度函数都可通过标准正态分布得到
3.3 指数分布
若随机变量 𝑋 具有概率密度函数
𝑓 (𝑥) =
𝜆𝑒
𝜆𝑥
, 𝑥 > 0
0 , 𝑥 0
其中 𝜆 > 0 为常数, 𝑋 服从参数 𝜆 的指数分布. 其分布函数为
𝐹 (𝑥) =
1 𝑒
𝜆𝑥
, 𝑥 > 0
0 , 𝑥 0
3.3.1 寿命近似与失效率函数
引入失效率函数 (𝑥) 表示元件在时刻 𝑥 尚能正常工作, 在时 𝑥 后单位时间内发生失效的概率. 𝑋
表示某原件的寿命, 则失效率函数即为
(
𝑥
)
=
lim
Δ𝑥0
𝑃(𝑥 𝑋 𝑥 + Δ𝑥|𝑋 > 𝑥)
Δ𝑥
故有
(𝑥) =
𝐹
𝑥
(𝑥+Δ𝑥 )𝐹
𝑥
(𝑥)
Δ𝑥 ·𝐹 (𝑥)
=
𝑓 (𝑥 )
1𝐹 (𝑥)
若有 (𝑥) = 𝑐𝑜𝑛𝑠𝑡, 就得到了指数分布
若希望失效率随事件变化, 那么就可以对指数分布作调整,
𝑓 (𝑥) = 𝜆𝛼𝑥
𝛼1
𝑒
𝜆𝑥
𝛼
这个形式是凑出来了, 它满足
+∞
𝑓 (𝑥)𝑑𝑥 = 1
并且有
𝐹 (𝑥) = 1 𝑒
𝜆𝑥
𝛼
这样就可以得到失效率函数为
(𝑥) = 𝜆𝛼 𝑥
𝛼1
3.3.2 指数分布的无记忆性
若有
𝑓 (𝑥) = 𝜆𝑒
𝜆𝑥
代入即可验证
𝑃(𝑋 > 𝑠 + 𝑡 |𝑥 > 𝑡) = 𝑃(𝑋 > 𝑠)
反过来若概率满足上式, 将条件概率展开即可得到
𝑃(𝑋 > 𝑠 + 𝑡) = 𝑃(𝑋 > 𝑠)𝑃(𝑋 > 𝑡)
也就是
𝐹 (𝑠 + 𝑡) = 𝐹(𝑠)𝐹 (𝑡)
𝑠 = 0 得到
𝐹 (0) = 1
将上式变形, 靠近导数形式
𝐹 (𝑥 + ) 𝐹 (𝑥)
=
𝐹 (𝑥)𝐹 () 𝐹 (𝑥)
𝐹 (𝑥 + ) 𝐹 (𝑥)
= 𝐹 (𝑥) ·
𝐹 () 1
于是就能得到
𝐹 (𝑥)
= 𝐹 (0)𝐹 (𝑥)
解之, 得到
𝐹 (𝑥) = 1 𝑒
𝐹
(0)𝑥
就得到 𝑋 服从指数分布