概率分布律和概率密度分布函数

Author : 张一极

email : zk@likedge.top

为彻底彻底梳理一遍关于概率和概率密度分布函数的概念

23:19-20201118

样本可能性空间和可能性取值

引例: 掷骰子

两次,两次的取值均为所属范围[1,6],此为样本空间,两次事件,取值可确定,并且可以罗列,成为离散类型的样本事件

分布律

还是掷骰子,的分布律可以表示为:

这个分布律的概念,不同教材方式可能不尽相同...如果有问题的话欢迎email我及时改正.

分布律指的是取不同数值的概率分布,只有离散类型变量有分布律的概念.

由上面的p分布表达式,可以进一步写出分布函数,是一个随机变量,这个变量小于F(x)的自变量的取值过程,即所谓的分布函数.

表示意思是: “随机变量取值不大于 x ”

随机变量的分布函数 F (x) 是以事件 的概率 定义的函数,它是自变量 x 的取值在 R 内的 一个普通函数,其值域为 [ 0 , 1 ]

Some Tips:

分布函数具有:

1.

x趋于负无穷的时候,概率为0,x趋于正无穷,概率为1

2.单调不减!单调不减!单调不减!!

3.

右连续,左侧函数值(分段点)等于下一段分段点开始点的函数值

4.

计算方式!很重要!!!

分布函数的意义在于,他包括了小于某个数值的所有变量取值的概率情况,即数轴上某个点左侧所有变量的概率之和就是分布函数在这个点的函数值.

分布密度函数

使

概率密度体现在不同区间段内的分布函数密度,表现形式为分布函数的导数,反推可知,某个区间段的导数,往回积分得到的就是这个分布函数值

特点:

总结: 分布密度函数的面积就是对应范围的概率

人话:

一个变量可能取哪些值,以及取到这些值的概率是多少,即概率分布,而描述这个分布的,就是概率密度或者概率分布函数:

归类:

离散型随机变量

连续型:

这里! F(x)代表某一个可以度量的区间的概率

假如是1到2的范围,即对f(x)求范围1到2的积分

常见离散型随机变量分布

二项分布

二项分布的随机变量只取两个值,0和1,其概率如下

01
p1-p

伯努利分布

多次二项分布的重复试验,即伯努利分布:

k是试验次数,代表的是n次里面k次成功的排列组合(有几次),乘以,一次成功概率是p,k次即,再乘以(1-p)的失败概率发生剩余的

几何分布 : 伯努利实验进行n次()

n次伯努利实验,前n-1次失败,即, 首次成功,一旦成功就停止, 概率为p

那么其k次成功的分布律为:

泊松分布

泊松分布可以近似看成n无限大的伯努利实验,与几何分布不同的是,首次成功不停止,直到完成n次试验.

其中

描述的是大量事件中稀有事件发生概率,常用来描述 大量试验中稀有事件出现次数的 概率分布的数学模型。

计算某个事件发生的概率,只需要一个泊松分布的参数即可

超几何分布

其极限! 即二项分布,其与伯努利分布的区别是有无放回

某一部分事件中,存在可数的非相同事件,(n个好东西里面有m个坏东西)

求取出a个东西,里面包含坏东西数量(b表示)的分布情况,就是超几何分布描述的情况

分母表示n个取a个事件,分子表示m个坏的中取b个坏的,再从生下n-m个好的中取a-b个好的.

当取的数目趋于无穷的时候,表示无穷多次的事件中,其概率分布接近二项分布,注意,只有n明确趋于无穷才有此类情况

连续型随机变量分布

Uniform distribution均匀分布

区间长度大的,对应概率一定较高

均匀分布,密度函数为, 即区间长度倒数,可知其分布函数(积分回去):

Exponential distribution指数分布

密度函数:

期望值为

分布函数:

 

Nomoral distribution正态分布

分布函数:

性质:

最大值


不同随机变量的分布函数和概率密度转换

随机变量X的分布函数为,这里为变量,不同的x取得不同的P,取的x合并即分布函数.

F(x)的导函数为概率密度函数,这里x依然是变量,这里的x表示积分范围,也就是说,,上下限由需求决定,给了概率密度可以通过积分求出对应范围的P(x)

一个分布函数代表的变量范围一定是R,如果另一个随机变量是这个变量的某个初等函数,可以通过已知的第一个分布函数范围,求出另一个初等变换后的的随机变量分布函数,求导后即概率密度.

以上式子会得到一个关于的变量范围,对这个范围的这个函数积分得到的结果就是新变量的分布函数,求导可得概率密度.

分布函数的X一定小于F(x)里面的x,因为表达式就是这样的:

一定!!

小于!!!

所以你计算概率密度反推分布函数的时候,密度函数的分段情况,在计算的时候,别忘了加上对应分段前面分段部分的函数积分.

例如积分,不可以仅仅计算(-1,5)的积分片段,还需要计算从这部分,这部分积分由分段函数确定


连续性:

,即a点函数值等于趋于a点的极限

由于我们写分布函数默认右连续,故我们在函数分段点求值的时候,可以用上一段末尾的函数值,等同于这一段开头的函数值:

在这一段分布函数中,可以得到一个结论,即

image-20201120143133203


1.概率密度反推积分的时候,范围应该等于其P{}的括号内的范围

2.已知x概率密度函数,求Y=f(x)的分布函数,应该首先代入,这里的y作为整个R的取值范围出现,代入,可得到关于的范围,,计算,这里的范围由y和x的关系确定,对应范围的积分,即随机变量Y的分布函数

End

20201121-18:28