随机变量的分布函数

四、随机变量的分布函数

1.分布函数及其性质

img

设X是一个随机变量,对于任意实数x,令

img

称F(x)为随机变量X的概率分布函数,简称分布函数.

对于任意两个实数x1,x2(x1<x2),随机变量X取值区间(x1,x2]的概率为

img

分布函数性质:

(1)对于任意实数x,0≤F(x)≤1;

(2)img

(3)F(x)是非单调增函数,即对于任意x1<x2,有F(x1)≤F(x2).

2.离散型随机变量的分布函数

已知离散型随机变量的分布列p{X=xi}=p(xi)=pi(i=1,2,…),则分布函数为

img

3.连续型随机变量的分布函数

已知连续型随机变量的密度函数f(x),则分布函数为

img

例2 有一批产品共40件,其中有3件次品.从中随机抽取5件,以X表示取到次品的件数,求X的分布列及分布函数.

解 随机变量X可能取到的值为0,1,2,3,按古典概率计算事件{X=k}k=0,1,2,3的概率,得X的概率分布为

img

或如表6-4所示.

表6-4

img
img
img

4.常见离散型随机变量的分布

(1)两点分布

若随机变量X只有两个可能的取值0和1,其概率分布如表6-5所示.

表6-5

img

img

则称X服从参数为p(p>0)的两点分布(也称0-1分布).

例4 假设某篮球运动员投篮命中率为0.8,X表示他投篮一次命中的次数,求X的概率分布.

解 投篮一次只有“不中”和“命中”两个结果,命中次数X只可能取0、1两个值,且概率分别为

img

也可表示为如表6-6所示.

表6-6

img

(2)二项分布

设X表示n重贝努里试验中事件A发生的次数,则X所有可能的取值为0,1,…,n,且相应的概率为

img

称X服从参数为n、p的二项分布,记作XB(n,p).

例5 某厂需从外地购买12只集成电路.已知该型号集成电路的不合格率为0.1,问至少需要购买几只才能以99%的把握保证其中合格的集成电路不少于12只?

解 设需要购买n只,X表示这n只集成电路中合格品个数,则XB(n,0.9),按题意,要求事件“X≥12”的概率不小于0.99,即

img

可算出至少需要购买17只集成电路,才能以99%的把握保证其中合格品不少于12只.

(3)泊松分布

若一个随机变量X的概率分布为

img

其中λ>0为参数,则称X服从参数为λ的泊松分布,记作Xp(λ).

例6 某商店根据过去的销售记录知道某种商品每月的销售量可以用λ=10的泊松分布来描述.为了以95%以上的把握保证不脱销,问商店在月底应存有多少件该种商品(假设只在月底进货)?

解 设该商店每月的销售量为X,据题意Xp(10).设月底存货为a件,则当X≤a时就不会脱销.即求a使得

img

查泊松分布表可得img,于是这家商店只要在月底保证存货不少于15件就能以95%以上的把握保证下月该商品不会脱销.

在实际应用中,当n比较大,p较小,而np不太大时,可直接利用以下近似公式:

img

5.常见连续型随机变量的分布

(1)均匀分布

一个随机变量X,如果其密度函数为

img

则称X服从[a,b]上的均匀分布,记作XU(a,b).

例7 某公共汽车站每隔5分钟有一辆车通过,可将车站上候车的乘客全部运走.设乘客在两趟车之间的任何时刻到站都是等可能的,求乘客候车时间不超过3分钟的概率和乘客平均候车时间.

解 设乘客到达汽车站的时刻为X,他到站前最后离去的公共汽车到站时刻为t0,将要来到的下一辆车的到站时刻为t0+5.据题意,X服从[t0,t0+5]上的均匀分布,其密度函数为

img

乘客候车时间不超过3分钟的概率,即X落在区间[t0+2,t0+5]内的概率

img

(2)指数分布

一个随机变量X,如果其密度函数为

img

其中λ>0为参数,则称X服从参数为λ的指数分布,记作XExp(λ).

例8 假设某种热水器首次发生故障的时间X(单位:小时)服从指数分布Ex p(0.002),求:(1)该热水器在100小时内需要维修的概率是多少?(2)该热水器平均能正常使用多少小时?

img

该热水器平均能正常使用500小时.

(3)正态分布

一个连续型随机变量X,如果其密度函数为

img

其中μ、σ为常数,-∞<μ<+∞,σ>0,则称X服从参数为μ和σ2的正态分布,记作XN(μ,σ2).

特别地:

当μ=0,σ=1的正态分布称为标准正态分布,记作N(0,1).

设Φ(x)=P(X<x),利用P(x1<X<x2)=Φ(x2)-Φ(x1),通过查标准正态分布表计算.

一般正态分布可以通过线性变换img转化为标准正态分布,再利用标准正态分布表求相应的概率,即

img
img

正态随机变量X的取值位于均值μ附近的密集程度可用标准差σ为单位来度量,而且X的取值几乎全部落在区间(μ-3σ,μ+3σ)之内,所以有时称3σ为极限误差.