数学要做一件事情,就是把这些随机事件进行统一化,数量化。
ω代表具体发生的一个事件,X代表一个特殊的映射,X=X(ω),这样就把具体的事件映射到数轴上一个具体的数值。
如投篮:投进映射成1,投不进映射成0.
一般的函数如果是取10,就是一个确定的值,没有概率。但是ω是以一定的概率取某个值(比如取掷骰子的3点),或者发生某件事情。映射出来的函数值自然也是有概率的。因为X是随机出现的变量,简称随机变量。
X起到的作用就是映射统一化。
注解:
1.ω具有随机性,所以映射出的X也具有随机性,这叫随机变量。
1.x是确定性变量,y也是确定变量。
随机事件也要用上微积分,不然白发明了。怎么用上呢?
大多数函数都是连续可导,指数函数,对数函数,。。。这些都能用上微积分,如求导。可以利用微积分的知识求最值。
ω是一个事件,谈不上连续,可导。所以要让随机事件连续,可导,那就只能制造一个函数:F(x),它定义为:一个事件发生的概率。
1.小x要取遍(-∞,+∞)内所有的数。分布函数的定义域是(-∞,+∞),即在整个实数域上处处有定义的函数。
1.随机事件映射到数轴上的数不可能小于-∞,所以小x趋于-∞时是不可能事件。不可能事件的概率是0,此时,F(x)=0
1.随机事件映射到数轴上的数一定小于+∞,所以小x趋于+∞时X(ω)≤+∞是必然事件。必然事件的概率是1,此时,F(x)=1
什么样子的函数是分布函数?分布函数具有哪些特点?
1.分布函数的值是概率值。
1.右连续。
2.一个题目:
3.分布函数一定是非负的,因为它是概率的累加。
1.可以用掷骰子的例子考虑,p(x=1)=1/6,p(x=2)=1/6,p(x=3)=1/6,p(x=4)=1/6,p(x=5)=1/6,p(x=6)=1/6。
1.f(x)很奇妙的一个函数。
概率分布和概率密度是什么意思?
概率分布的着眼点是概率。满足(概率)分布律的随机变量叫做离散型随机变量,可以用掷骰子为例思考。
律:规律。
1.满足上面那个积分式子的随机变量叫做连续型随机变量.
2.只要谈概率密度函数,一定是连续型随机变量,只要谈概率分布,一定是离散型随机变量。
1.高一点的地方密度大,低一点的地方密度小。
2.概率密度函数中的密度是借鉴物理学中的概念。
1.因为概率密度函数在整个实数域上的积分(面积)是1,概率密度函数在一点处无法测出面积,那就测在这一点处微分邻域的面积,来代表这一点处的面积。
2.连续型随机变量的概率密度函数研究的是在数轴上每个点的地方取值(一个取值对应某个事件的映射)可能性大小的问题。
3.可以和离散型随机变量的概率取值进行对比。
4.概率密度函数,以函数值的不同定义数轴上某个位置取值大小,取值大,就意味着事件发生的概率大,取值小,就意味着事件发生的概率小。
5.f(x)在非均匀质量细杆中就是密度函数。
1.为什么f(x)整个实数区间的积分是1,因为是概率,所有概率加起来取值是1.
1.利用离散型随机变量的概率分布律和连续型随机变量密度函数的这4个特点,建立方程,反求未知参数。
以下雨为例子,1到6点期间每一秒下雨的可能性是等可能的,那3点~5点下雨的概率就是(5-3)/(6-0)=2/6=1/3.也是下面的面积的比值(阴影部分的面积/整个矩形的面积):
但是有的事件的发生不是等可能的,如:
此时,求发生在某一区间的事件的概率的时候,还是要用面积的比值,就是阴影部分的面积/整个面积,整个的面积=1,阴影部分的面积要用积分进行求取,那既然要用积分,就必须定义一个函数,这个定义的函数f(x)就是概率密度函数。
小结:发生在某一区间段内的事情的概率就是概率密度函数在那个区间的积分。
参考1:
都是翻译的锅,CumulativeDistributionFunction,简称CDF.直接翻译为渐增分布函数不就好了
参考2:
①概率函数
概率函数,顾名思义,用函数的形式来表达概率:
②概率分布
概率分布,顾名思义,就是概率的分布,还是讲的"概率",不过侧重点在于"分布",为便于理解,我们来看一张图:
在很多书中,上面的列表叫做离散型随机变量的"概率分布",其实严格意义来说,应该叫做"离散型随机变量的值分布和概率分布".名字虽长了一点,但有利于我们更好的理解.
举例:一颗具有6面的骰子,每一个面对应的数字为1,2,3,4,5,6,随机摇骰子,每一个数字出现的概率都为1/6,你说下面的列表是骰子取值的概率分布吗?
分析:上面是骰子的取值,下面是取值所对应的概率,看起来,好像就是概率分布啊,其实大错特错,骰子的取值要包括:所有可能的取值,上面的取值漏掉了6.
③分布函数
分布函数又是个什么东东,其实它的全名叫做:概率分布函数.
我们来讲一下它的定义:
其实上面定义所讲的"分布律"就是我们前面所说的"概率函数"
如果你仔细推敲"概率分布函数"的定义,就会发现它就是概率函数中的概率累加的结果,所以它又叫做"累积概率函数".
概率函数与概率分布函数其实就是一个硬币的两面,只是用不同的方式来描述概率.
其实连续型随机变量的概率函数换了一个名字,叫做"概率密度函数".
为啥要换名字呢,其实我们仔细一想就能大致明白,连续型随机变量的数值是连续的,求它的概率是有"问题"的,就像一个物体,你要计算它每个点所对应的"质量".
下面我们来看一下,陈希孺老师所著的《概率论与数理统计》对密度函数的描述:
"密度函数"这名字由来可解释如下.
可能说到这里,大家还是有点懵,继续往下看:
分析:概率密度函数其实一个定积分的函数,定积分在数学一般用来求面积,在这里你把"概率"理解为"面积"即可.
下面回答一些常见问题:
Q:概率密度函数在某点的函数值,有什么意义?
A:其实概率密度函数值即为概率在该点的变化率.
千万不要误认为:概率密度函数值是该点的概率.
举例:速度(概率密度)和距离(概率)
某一点的速度不能认为是某一点的距离,这样是没有意义的.
因为距离是从XX到XX的概念,所以概率也要有区间.
参考:
参考3:
概率分布有两个词组成,概率+分布。
概率指的是一些数据出现的可能性。
分布指的是数据的稀疏和稠密。
分布:数据在统计图中的分布。
概率分布:将随机变量,概率,分布组合一起的手段。用统计图表示随机变量可能出现的结果发生的概率。横轴是随机变量的数字,是随机事件的所用可能结果,纵轴是横轴上某个随机事件发生的概率。
概率分布是用统计图来表示随机变量所有可能结果和对应结果发生的概率。
概率分布就是在统计图中表示概率,横轴是数据的值,纵轴是横轴上对应数据值的概率。
离散型概率分布,要求把所有可能出现的情况全部都列出来,少一个都不行
很显然的,根据数据类型的不同,概率分布分为两种:离散概率分布,连续概率分布。
那么,问题就来了。为什么你要关心数据类型呢?
因为数据类型会影响求概率的方法。
对于离散概率分布,我们关心的是取得一个特定数值的概率。例如抛硬币正面向上的概率为:p(x=正面)=1/2
而对于连续概率分布来说,我们无法给出每一个数值的概率,因为我们不可能列举每一个精确数值。
接下里,我们一起来聊聊常见的4种概率分布。
1)3种离散概率分布
2)1种连续概率分布
什么是二项分布呢?只要符合下面3个特点就可以判断某事件是二项分布了:
1)做某件事的次数(也叫试验次数)是固定的,用n表示。
(例如抛硬币3次,投资5支股票),
2)每一次事件都有两个可能的结果(成功,或者失败)
(例如每一次抛硬币有2个结果:正面表示成功,反面表示失败。
每一次投资美股有2个结果:投资成功,投资失败)。
3)每一次成功的概率都是相等的,成功的概率用p表示
(例如每一次抛硬币正面朝上的概率都是1/2。
你投资了5家公司的股票,假设每一家投资盈利成功的概率都相同)
4)你感兴趣的是成功x次的概率是多少。那么就可以用二项分布的公式快速计算出来了。
(你已经知道了我前面讲的5家美股的赚钱概率最大,所以你买了这5家公司的股票,假设投资的这5家公司成功的概率都相同,那么你关心其中只要有3个投资成功,你就可以赚翻了,所以想知道成功3次的概率)
3.二项分布如何计算概率?
怎么计算符合二项分布事件的概率呢?也就是你想知道下面的问题:
上面我们已经知道了二项分布的4个特点,并知道每个特点的表示方法:
这时候,二项分布的公式就可以发挥威力了:
这里你也别害怕数学公式,每一项的含义我前面已经讲的很清楚了。这个公式就是计算做某件事情n次,成功x次的概率的。很多数据分析工具(Excel,Python,R)都提供工具让你带入你研究问题的数值,就能得到结果。
例如,抛硬币5次(n),恰巧有3次正面朝上(x=3,抛硬币正面朝上概率p=1/2),可以用上面的公式计算出出概率为31.25%(用Excel的BINOM.DIST函数,Python,R都可以快速计算)
第2种:几何分布
其实我一直把几何分布,叫做二项分布的孪生兄弟,因为他两太像了。只有1点不同
我们还是从下面这个套路聊起来一起找出这个不同的“劲爆点”:
1.几何分布有啥用?
如果你需要知道尝试多次能取得第一次成功的概率,则需要几何分布。
2.如何判断是不是几何分布?
只要符合下面4个特点就可以判别你做的事情是就是几何分布了:
你表白你的暗恋对象,你希望知道要表白3次,心仪对象答应和你手牵手的概率多大。)
正如你上面看到的,几何分布和二项分布只有第4点,也就是解决问题目的不同。这个点够不够劲爆?(嘻嘻)
第3种泊松分布
还是同样的味道,还是同样的讨论,我们一起通过下面3个问题了解这个泊松分布。
1.泊松分布有啥用?
知道这些事情的概率有啥用呢?
当然是根据概率的大小来做出决策了。比如你搞了个抽奖活动,最后算出来一天内中奖10次的概率都超过了90%,然后你顺便算了下期望,再和你的活动成本比一下,发现要赔不少钱。那这个活动就别搞了。