对概率的另一种解释
在日常谈话中,这个词概率不仅适用于可变现象,而且适用于不确定命题真实性.任何关于实验结果的命题的真实性在实验开始之前都是不确定的。许多其他不确定命题不能用可重复的实验来定义。一个人可能不确定某事的真实性科学理论宗教教义,甚至在目击证人不充分或相互矛盾的情况下,对某一特定历史事件的描述。用概率作为测量不确定性理论将其应用范围扩大到不符合可重复性要求的现象。的伴随的缺点是概率作为不确定性的衡量标准是主观的,而且因人而异。
根据一种解释,说某人有主观概率p命题为真意味着对于任何整数r而且b与r/ (r+b) <p,如果这个人有机会就命题的真假或“单次抽红”下注相同金额r红色和b黑球,他喜欢第一个赌注,而如果r/ (r+b) >p,他更喜欢第二种赌法。
一个重要的刺激对现代思想中关于主观概率的认识一直是一种尝试决策面对不完整的知识。它假定,当一个人面临做出决定的必要性时,根据他所不完全了解的情况可能会产生不同的结果,他可以以一种与理性行为的某些公理一致的方式表达他的个人偏好和不确定性。然后就可以推断出这个人有效用函数一种是“主观概率分布”,它定量地表达了他对不确定情况的信念。个人的最佳决策是最大化他的决策期望效用关于他的主观概率。效用的概念至少可以追溯到丹尼尔·伯努利(雅各布·伯努利它是在20世纪由约翰·冯·诺依曼而且奥斯卡·摩根,弗兰克·拉姆齐,莱纳德·j·萨维奇等人。Ramsey和Savage强调了主观概率作为面对不确定性时决策的伴随成分的重要性。一个替代不使用主观概率的方法效用理论由布鲁诺·德·费内蒂开发。
概率论的数学理论是一样的,不管一个人如何解释这个概念,尽管对各种结果的重视程度可能在很大程度上取决于解释。特别是在主观概率的理论和应用中,贝叶斯定理起着重要的作用。
例如,假设瓮中含有N球,r其中有红色和b=N−r都是黑色的,但是r(因此b)是未知的。一个人被允许了解价值的r通过进行替换拉拔实验n骨灰盒里的球。再假设一个人有主观性概率分布给出概率f(r)红球的数量是多少r在哪里f(0) +⋯+f(N) = 1。这个分布叫做一个先验分布,因为它是在从瓮中抽出球的实验之前指定的。的二项分布现在是条件概率的值r.最后,可以用贝叶斯定理求出瓮中未知数量的红球的条件概率r,假设从瓮中取出的红球数为我.结果是
该分布是利用贝叶斯定理将实验结果的先验分布与条件分布结合起来得到的后验分布。
这种计算的优点是,它使概率陈述成为可能作文瓮的,这是不能直接观察到的,从可观察的数据来看,从瓮中提取的样品的组成。缺点是,如上所述,不同的人可能先验地对瓮的组成选择不同的主观概率,从而对瓮的组成得出不同的结论。
要了解这一想法如何在实践中应用,请考虑一个简单的瓮模型民意调查,以预测两位候选人中哪一位将赢得选举。骨灰盒里的红球代表将投票给候选人的选民一个黑球代表投票给候选人的人B.从选民中选择一个样本并询问他们的偏好是一个定义良好的随机实验,在理论上和实践中都是可重复的。瓮的组成是不确定的,不是一个明确的随机实验的结果。然而,在某种程度上,投票给一个候选人就是投票给一个政党,其他选举提供有关骨灰盒内容的信息,如果使用得当,应该是有帮助的补充对实际样本的结果做出预测。如何准确地利用这些信息是一个难题,个人判断在其中起着重要的作用。一种可能是将先验信息合并到关于选民的先验分布中,然后通过贝叶斯定理与样本的结果结合,并由后验分布进行总结。
大数定律,中心极限定理,泊松近似
的大数定律
概率的相对频率解释是,如果一个实验在相同条件下独立地重复大量次,那么一个事件发生的相对频率一个实际发生的概率一个应该是差不多的。这种解释的数学表达式是大数定律。这定理说如果X1,X2、……Xn独立随机变量是否具有均数μ的共同分布,则对于任意数ε > 0,无论多小,为n→∞,
大数定律最初是由雅各布·伯努利在一个特殊的情况下证明的Xk1或0是否等于k从装有。的瓮中取出的r红色和b黑球是红色或黑色的。然后E(Xk) =r/ (r+b),以及最后一项方程说的是概率的不同经验红球的比例n如果抽到红的概率小于ε”,则收敛为1 asn变得无限大。
只要一个概率非常接近于1的事件实际上肯定会发生,这个结果就证明了概率的相对频率解释是正确的。然而,严格地说,这个论证是循环的,因为上面方程中的概率非常接近但不等于1,需要它自己的相对频率解释。也许更好的说法是,弱大数定律与概率的相对频率解释是一致的。
下面是简单的证明大数定律的基础切比雪夫不等式,这说明了方差一个分布的值衡量的是分布的情况分散关于它的平均值。如果X是一个随机变量与分布f和μ的平均值,则根据定义Var(X) = Σ我(x我−μ)2f(x我).因为这个和中的所有项都是正的,所以只有省略一些项,这个和才会减小。假设省略了|中的所有项x我−μ| <b,在那里b是一个任意给定的数字。和中剩下的每一项都有一个形式为(x我−μ)2,大于或等于b2.因此,Var (X)≥b2Σ”f(x我),其中求和符号上的质数表示只与|相关x我−μ|≥b都包括在总和中。契比雪夫不平等这个表达式可以改写为吗
该不等式可应用于式(11)中出现的补事件,有b=ε。的XS是独立的,分布相同,E[n−1(X1+⋯+Xn) = μ和Var[(X1+⋯+Xn) /n= Var(X1) /n,所以
这不仅证明了式(11),而且还定量地说明了有多大n应该是这样的,经验平均,n−1(X1+⋯+Xn),近似于期望精确到任何需要的程度。
假设,例如,比例p瓮中红球的数量是未知的,由一个样本大小中红球的经验比例来估计n从装有替代品的瓮中取出。切比雪夫不等式Xk= 1{红球上k图}表明,为了使所观察到的比例在真比例的ε范围内p概率至少是0.95就足够了那n至少为20 × Var(X1) /ε2.由于Var (X1) =p(1−p)全部≤1/4p,当ε = 0.03时,它就足够了n至少是5555。的值如下所示n比必要的要大得多,因为切比雪夫不等式不够精确,无法用于数值计算。
虽然雅各布·伯努利他不知道切比雪夫不等式,他推导的不等式也是不精确的,也许是因为他对没有在数量上有用的近似感到失望,他在一生中没有发表这个结果。这本书出现在1713年,也就是他死后八年。