第二章 一维随机变量及其分布
Post on 04-Jan-2016
104 Views
Preview:
DESCRIPTION
TRANSCRIPT
第二章 一维随机变量及其分布
第一节 随机变量
第二节 离散型随机变量
第三节 随机变量的分布函数
第四节 连续型随机变量
第五节 随机变量的函数的分布
第一节 随机变量定义设 X = X () 是定义在样本空间上的实值函数,称 X = X () 为随机变量。随机变量通常用大写字母 X, Y, Z,W …, 等表示。下图给出样本点与实数 X = X () 对应的示意图
1e
2e
3e x
例 1 一射手对目标进行射击,击中目标记为 1 分,未中目标记为 0 分。设 X 表示该射手在一次射击中的得分,它是一个随机变量,可以表示为
未中。击中;
,0
,1X
例 2 观察一个电话交换台在一段时间( 0, T )内接到的呼叫次数。如果用 X 表示呼叫次数,那么 表示一随机事件,显然 也表示一随机事件。
),2,1,0(}{ kkX
),2,1,0(}{ kkX
( )B X I
( ) ( ) .P X I P B P X I
随机变量的取值随试验的结果而定,而试验的各个结果出现有一定的概率,因而随机变量的取值有一定的概率。
按照随机变量可能取值的情况,可以把它们分为两类:离散型随机变量和非离散型随机变量,而非离散型随机变量中最重要的是连续型随机变量。因此,本章主要研究离散型及连续型随机变量两种
BIXI 记为事件是一个实数集合若一般的 }{,,
即
于是
定义 如果随机变量的全部可能取的值只有有限个或可列无限多个,则称这种随机变量为离散型随机变量。
),2,1( kxk
X 取各个可能值的概率,即事件 的概率为}{ kxX
,,2,1,}{ kpxXP kk ( 1)
称( 1 )式为离散型随机变量 X 的分布律 。
一般地,设离散型随机变量 X 所有可能取的值为
分布律也可以直观地用下面的表格来表示:
X nxxx 21
kp nppp 21
由概率的定义,式( 1 )中的 应满足以下条件: kp
,,2,1,01 kpk。
.121
kkp。
随机变量 X的所有取值
随机变量 X的所有取值随机变量 X的各个取值所对应的概
率
随机变量 X的各个取值所对应的概
率
例3 设随机变量X的分布律P(x=k)= N
a,
k=1,2…,,N 试确定常数
解:
N
k
N
k N
aN
N
akxP
1 1
1)(
所以=1
第二节 离散型随机变量 例 1 某系统有两台机器相互独立地运转。设第一台与第二台机器发生故障的概率分别为 0.1 , 0.2 ,以 X 表示系统中发生故障的机器数,求 X 的分布律
2,1iiAi ”台机器发生故障 ,“表示事件 第设解72.08.09.0)(}0{ 21 AAPXP
26.02.09.08.01.0)()(}1{ 2121 AAPAAPXP
02.02.01.0)(}2{ 21 = AAPXP
故所求概率分布为: X 210
kp 02.026.072.0
(一)( 0 - 1 )分布
设随机变量 X 只可能取 0 与 1 两个值,它的分布律是
)10(1,1,0,}{ 1 pqpkqpkXP kk
则称 X 服从( 0 - 1 )分布或两点分布。
( 0 - 1 )分布的分布律也可写成
X 10
kp pq
抛一枚硬币,观察出现正面 H 还是反面T ,正面 X= 0, 反面X= 1
TH
对于一个随机试验,如果它的样本空间只包含两个元素,即 ,我们总能在上定义一个服从( 0 -1 )分布的随机变量。
},{ 21
.,1
,,0)(
2
1
当当
XX
来描述这个随机试验的结果。
检查产品的质量是否合格,对新生婴儿的性别进行登记,检验种子是否发芽以及前面多次讨论过的“抛硬币”试验都可以用( 0 - 1 )分布的随机变量来描述 。
伯努利试验是一种非常重要的概率模型,它是“在同样条件下独立地进行重复试验或观察”的一种数学模型,有着广泛的实际应用。
设试验 只有两个可能结果: 及 , 则称 为伯努利( Bernoulli )试验。设 ,此时 ,将 E 独立地重复地进行 n 次,则称这一串重复的独立试验为 n 重伯努利试验。
EA A)10()( ppAP
pAP 1)(
E
(二) 伯努利试验与二项分布
现在求它的分布律 。次这一事件,正好出现重伯努力试验中时间记若以 kAnBk
出现的次数,重伯努力试验中事件表示以 AnX
,},{ AiAkX i 次试验中出现事件表示第而以即事件
iA i A以 表示第次试验中出现 ,则nknknnkkk AAAAAAAAAAB 121121
,次试验出现另外次试验出现事件右边的每一项表示某 AknAk ,
由试验的独立性,得 )()()()()()( 121121 nkknkk APAPAPAPAPAAAAAP
这种项共有 个,而且两两互不相容。 n
k
knk qp pq 1其中
nknknnkkk AAAAAAAAAAB 121121
同理可得上式右边各项所对应的概率均为
knk qp
( ) k n kk
nP B p q
k
即 0 1 2 ,k n kn
P X k p q k nk
, ,,, ,
利用概率的加法定理知
显然 0kXP
0 0
( ) 1n n
k n k n
k k
nP X k p q p q
k
满足分布律的两个条件即 kXP
注意到 刚好是二项式 的展开式中 k n knp q
k
nqp )(
的二项分布服从参数为量的那一项,故称随机变出现 pnXp k ,
X记为 ),( pnb~
例 2 已知某类产品的次品率为 0.2 ,现从一大批这类产品中随机地抽查 20 件,问恰好有 k(k=0,1,2,…,20) 件次品的概率是多少?
解 这是不放回抽样。但由于这批产品的总数很大,且抽查的产品的数量相对于产品的总数来说又很小,因而可以当作放回抽样来处理。这样做会有一些误差,但误差不大我们将检查一件产品是否为次品看成是一次试验,检查 20 件产品相当于做 20 重伯努利试验。以 X 记抽出的 20 件产品中次品的件数,那么 X 是一个随机变量,且 X ~ b(20,0.2)则所求的概率为
2020(0.2) (0.8) 0 1 20k kP X k k
k
, ,, ,
将计算结果列表如下:
kXP kXP k k
012345
0.0120.0580.1370.2050.2180.175
6789
10≥11
0.1090.0550.0220.0070.002
< 0.001
作出上表的图形,如下图所示
直至达到先是随之增加增加时,概率从上图可以看出,当 ,}{ kXPk
4k n p最大值( ),随后单调减少。一般地,对于固定的 及 ,二项分布
都有类似的结果),( pnb
例 3 设某种鸭在正常情况下感染某种传染病的概率为 20%现新发明两种疫苗,疫苗 A 注射在 9 只健康鸭后无一只感染传染病,疫苗 B 注射在 25 只鸭后仅有一只感染,试问应如何评价这两种疫苗,能否初步估计哪种疫苗较为有效?
解 若疫苗 A 完全无效,则注射后鸭受感染的概率仍为 0.2 ,故 9 只鸭中无一只感染的概率为
90.8 0.1342.
同理,若疫苗 B完全无效,则 25只鸭中至少有一只感染的概率为
25 1 24250.8 0.2 0.8 0.0274.
1
因为概率 0.0274较小,并且比概率 0.1342小得多,B A因此可以初步认为疫苗 是有效的,并且比 有效。
(三)泊松分布
0,1,2,X 设随机变量 所有可能取值为 ,
!ke
kXPk
,,,210k 0 其中 是常数
~ ( )X 记为
且有显然, ,,2,1,0}{ kkXP
10 0 0
k k k
kk
eek
ek
ekXP
!!
而取各个值的概率为
X 则称 服从参数为 的泊松分布,
满足分布律的两个条件即 }{ kXP
例 4 商店的历史销售记录表明,某种商品每月的销售量服从参数为 10 的泊松分布。为了以 95% 以上的概率保证该商品不脱销,问商店在月底至少应进该商品多少件? 解按题意要求为
件,件,月底的进货量为品设商店每月销售某种商 nX
95.0nXP
的泊松分布,则有服从 10X
n
k
k
ek0
10 95.010
!由附录的泊松分布表知
.95.09513.010
95.09166.010
15
0
10
14
0
10
k
k
k
k
ek
ek
!
,!
只要在月底进货 15 件 ( 假定上个月没有存货 ),就可以 95% 的概率保证这种商品在下个月内不会脱销 。
在几何上,它表示随机变量 X落在实数 x左边的概率
第三节 随机变量的分布函数是任意实数,函数是一个随机变量,设 xX定义
xXPxF )(
的分布函数称为X
分布函数是一个普通的函数,其定义域是整个实数轴。
X x
分布函数具有以下基本性质:
1)(0 xF1
的不减函数是xxF )(2
1)()(0)()( limlim
xFFxFFxx
,3
)()0( xFxF 是右连续的即 )(xF4
例 1 的分布律为设随机变量XX
kp-1 0 1
¼ ½ ¼ 10 XPX的分布函数,并求求
由概率的有限可加性分布函数为:
0 1
1 1 0
4( )3
0 141 1
x
xF x
x
x
0 1
0 1 0
(1) (0) 0
3 11
4 23
.4
P X
P X P X
F F P X
解
的图形如下图所示)(xF
1 0 1
1 1 11 0 1
4 2 4
F x
X
X
分布函数 的图形是一条阶梯曲线,
它在 =-、、处有跳跃
其跳跃值分别为 取-、、的概率 、、。
的分布函数为变量一般地,设离散型随机 X
,,, 21 kpxXP kk
的分布函数为由概率的可列可加性得X
}{
,2,1,)(
kk
k
xXPp
kxxxF
其跳跃值为处有跳跃,在分布函数
xx
k
k
pxF )(
kx x k对所有满足 的 求和。
例 2 在区间 [1,5]上任意掷一个质点 ,用 X 表示这个质点与原点的距离 ,则 X 是一个随机变量 .如果这个质点落在 [1,5]上任一子区间内的概率与这个区间的长度成正比,求 X 的分布函数。
{1 5}x 由题意知 是一个必然事件解
1, { } , ( ) { } 0x X x F x P X x 若 则 是不可能事件 )1(151 xkxXPx ,则若
5 {1 5} 1 1/ 4,x P X k 特别取 由 可得 从而 )1(
4
111)( xxXPxPxXPxF
1)(}{5 xFxXx 是必然事件,,则若
.5,1
51),1(4
1,1,0
)(
x
xx
x
xF的分布函数为X
1 5 1P X 即
的图形如下图所示)(xF
跳跃点。在整个数轴上没有一个)上的一个连续函数,是一个定义在(- ,)(xF
第四节 连续型随机变量
定义,使对于任意实数有负函数
如果存在非的分布函数对于随机变量)(
),(
xf
xFX
dttfxFx
概率密度。的概率密度函数,简称为称其中函数称为连续型随机变量,则
X
xfX )(
具有以下性质由定义知道,概率密度 xf
(1) 0f x (2) 1f x dx
1 2 1 2(3) , , ,x x x x对于任意实数 有 dxxfxFxFxXxP
x
x 2
11221
(4) ( ) '( ) ( )f x x F x f x若 在点 连续,则有
1 2
1 2
1 2
( , ]
{ }
( , ] ( )
( )
X x x
P x X x
x x f x
落在区间 上的概率
等于区间上曲线 之下的
曲边梯形的面积如图
性质 (1),(2) 是两个最基本的性质
性质 (1),(2) 是两个最基本的性质
有的连续点对于知由性质 xxf )(,)4(
x
xxXxP
x
xFxxFxf
xx
00limlim
直观。述它的分布比分布函数机变量,用概率密度描因此对于连续型随附近的值的概率大小。取映出
的大小能反的概率分布的密集程度在点而是的概率取值不是随机变量上式表明概率密度
xX
xfxX
xXxf
)(,
,)(
例 1 设连续型随机变量 X具有概率密度
. 0
,20 1
其他xkx
xf
k确定常数)1(
xFX的分布函数求)2(
25
23)3( XP求
2
0(1) ( ) 1, ( 1) 1f x dx kx dx
由 得
(2) X的分布函数为
1 ,1
20 ,4
1
0 ,0
2
x
xxx
x
dttfxFx
5 33 5(3) 2 2 2 2
1 0.9375 0.0625
P X F F
解:
1/ 2k 解得
均匀分布
具有概率密度设连续型随机变量X
. ,0
, ,1
其它
bxaabxf
),(,),( baUXbaX ~记为上服从均匀分布在区间则称
1,0)(
dxxfxf 且易知
满足连续型随机变量的两个最基本性质满足连续型随机变量的两个最基本性质
f x 的图形
与子区间的位置无关。而子区间的长度子区间的概率只依赖于落在
或者说可能性是相同的一等长度的子区间内的中任落在变量上服从均匀分布的随机在
,),(
,
),(),(
ba
X
baXba
的分布函数为X
bx
bxaab
ax
ax
xF
,1
,
,0
( )F x 相应的图形为
设随机变量 X在[2,5]上服从均匀分布,现对 X进行三次 独立观测。试求至少有两次测值大于 3的概率
依题意得:X的密度函数为
031
)(xf ;2<x<5 ;其他
设 y 表 示 二 次 独 立 观 测 其 测 值 大 于 3 的 次 数
则 5
3 3
2
3
1)3( dxxP
27
20)
3
2(
3
1)
3
2()2( 33
322
3 CCyP
例 2
解:
指数分布概率密度为设连续型随机变量X
.0 ,0
,0 ,
x
xexf
x
的指数分布。服从参数为则称常数为其中 X,0
10)(0
xedxxfxf 且易知
的分布函数为X
. ,0
0 ,1
其它,xe
xFx
满足连续型随机变量的两个最基本性质满足连续型随机变量的两个最基本性质
指数分布的概率密度及分布函数分别如图所示
例3
( )
1/1000 , 3 1000
X
已知某种电子元件寿命 单位:小时 服从参数
的指数分布 求 个这样的元件使用小时至少有一个已损坏的概率。
解: 的概率密度为X
.0 ,0
,0 ,1000
1 1000
x
xexf
x
1
10001000
edxxfXP于是
各元件的寿命是否超过 1000小时是独立的,因此 3 个元件使用 1000小时都未损坏的概率为 ,从而至少有一个已损坏的概率为
3e
31 e
正态分布概率密度为设连续型随机变量X
2
2
( )
21( ) ,
2
x
f x e x
。记为分布
的正态服从参数为则称为常数其中
),(~,
,,)0(,2
NX
X
+
-,下面来证明显然 1)(0)( dxxfxf
满足连续型随机变量的两个最基本性质满足连续型随机变量的两个最基本性质
得令 ,tx
2 2
2
( )
2 21 1
2 2
x t
e dx e dt
有利用广义积分 ,2
2
0
dxe x
2
2 2t
e dt
于是2
2
( )
211
2
x
e dx
如图所示)(xf
的图形就越平。的值越大,反之,当的图形越尖。的值越小固定时达到最大。当
处在对称的图形关于直线函数
)(
)(,,
)(,)(
xf
xf
xxfxxf
的分布函数为X2
2
( )
21( )
2
tx
F x e dt
如下图所示)(xF
表示,即有分别用其概率密度和分布函数。记为服从标准正态分布时称当
)(),(
)1,0(~,1,0
xx
NXX
2
21
( ) ,2
x
x e
2
21
( )2
tx
x e dt
( ) 1 ( )x x 易知
引理 若 2~ ( , )X N 则 ~ (0,1)X
Y N
4例
解:8 16 8
{ 16} { } (2) 0.97734 4
XP X P
8 8{ 0} { } ( 2) 1 (2) 0.0227
4 4
XP X P
12 8 8 20 8{12 20} { } (3) (1)
4 4 40.9987 0.8413 0.1574
XP X P
查表得的分布函数由引理及 ,X
已知 求 { 16}, { 0}P X P X 及 {12 20}P X )(8,4 ~ 2NX
5例 设 2~ ( , )X N 内的概率落在区间求 ),( kkX ),3,2,1( k
解: { } { }P X k P k X k ( ) ( )
2 ( ) 1
k k
k
于是 { } 2 (1) 1 0.6826P X
{ 2 } 2 (2) 1 0.9544P X
{ 3 } 2 (3) 1 0.9973P X
{ 3 } 1 { 3 } 0.0027 0.003P X P X 则有
不会发生。在实际问题中常认为它,以外的概率小于落在 003.0)3,3( X
)(
,10,}{),1,0(~
如下图所示分位点为标准正态分布的上称点则满足条件若设
u
uXPUNX
uux 1)( 的图形的对称性可知:由
第五节 随机变量的函数的分布在实际问题中,不仅需要研究随机变量,往往还要研究随机变量的函数 .即已知随机变量 X 的概率分布,求其函数 Y g (X ) 的概率分布 .
1例2(1) 2 (2) ( 1)
X
Y X Z X
设随机变量 具有以下分布(如下图),
试求 的分布律。
。的所有可能取值为 4,2,0,2)1( Y
的分布律为得由 YpkXPkYP k }{}2{
解:
4,1,0)2( 的所有可能取值为z2{ 0} {( 1) 0} { 1} 0.1P Z P X P X= = - = = = =
2{ 1} {( 1) 1} { 0} { 2} 0.6P Z P X P X P X= = - = = = + = =
2{ 4} {( 1) 4} { 1} 0.3P Z P X P X= = - = = =- =
的分布律为故z
2例也服从正态分布。=
的线性函数,试证明设随机变量baXY
XNX
),(~ 2
证明)(),(, yFxFYX YX的分布函数为分别记
)(,0 yFa Y下面先求设
)(yFY }{}{ ybaXPyYP
)(}{a
byF
a
byXP X
的概率密度为=求导,得关于将 baXYyyFY )(
)(yfY )(1
))(( '
a
byf
aa
by
a
byf XX
)(xf X而,,
2
1 2
2
2
)(
xe
x
所以 .,)(2
1)(
2)(2
)]([
xea
yf a
baxy
Y
同样的方法可以求得若 0a
xea
yf a
baxy
Y ,2
1)(
2
2
)(2
)]([
).)(,(~ 2 abaNbaXY 故
ba ,
1在上例中取特别的, 得 )1,0(~ NX
Y
果这就是上一节引理的结
3例的概率密度。求
具有概率密度设随机变量2
,),(
XY
xxfX X
解:。的分布函数先求
的分布函数为分别记)(
)(),(,
yFY
yFxFYX
Y
YX
时有当时,故当由于
0
0)(0,02
y
yFyXY Y
}{}{)( 2 yXPyYPyFY
}{ yXyP ( ) ( )X XF y F y- -
的概率密度为即得求导关于将 yyyFY ,)(
)(yfY
.0,0
0)],()([2
1
y
yyfyfy
XX )(1
~ (0,1),X N设 其概率密度为
,,2
1)( 2
2
xexfx
X 21 Y X由()得 的概率密度为
.0,0
0,2
1 22
1
y
yeyy
)(yfY
分布。的服从自由度为此时称 21 Y
定理 xxfX X ),(具有概率密度设随机变量
)0)('(0)(')( xgxgxg 或恒有处处可导且恒有函数其概率密度为是连续型随机变量则 ,)(XgY
.,0
,,)()]([ '
其它 yyhyhf X)(yfY
)),(),(max()),(),(min( gggg 其中
的反函数是 )()( xgyh
证明 严格在的情况。此时先考虑 ),()(0)(' xgxg
严格单调且在存在它的反函数单调增加 ),(,)(, yh
。的分布函数为增加、可导。分别记 )(),(, yFxFYX YX
1)(,0)(,
,),()(
yFyyFy
xgY
YY 时;当时故当取值在由于
时当 y
})({}{)( yXgPyYPyFY
)]([)}({ yhFyhXP X
的概率密度即得求导关于将 YyyFY ,)(
[ ( )] ( ),( )
0 ,X
Y
f h y h y yf y
其他
的情况,同样的有再考虑 0)(' xg
[ ( )][ ( )],( )
0 ,X
Y
f h y h y yf y
其他
式,命题得证。合并以上2
4例 内服从均匀分布在设随机变量 )2/,2/( X
的概率密度。试求随机变量YXY ,sin解: )2/,2/(sin)(sin 在对应的函数 xxgyXY
且有反函数上恒有 ,0cos)(' xxg21/1)(',arcsin)( yyhyyhx
)(xf X
其它
-
,022
,1
x的概率密度为X
sinY X由前面结论得 的概率密度为
)(yfY
其它
-
,0
11,1
112
yy
top related