概率分布gydF4y2Ba

假设gydF4y2BaXgydF4y2Ba是一个gydF4y2Ba随机变量gydF4y2Ba可以取其中一个值gydF4y2BaxgydF4y2Ba1gydF4y2Ba,gydF4y2BaxgydF4y2Ba2gydF4y2Ba、……gydF4y2BaxgydF4y2Ba米gydF4y2Ba,根据随机实验的结果,并考虑事件{gydF4y2BaXgydF4y2Ba=gydF4y2BaxgydF4y2Ba我gydF4y2Ba的简写符号gydF4y2Ba集gydF4y2Ba在所有实验结果中gydF4y2BaegydF4y2Ba这样gydF4y2BaXgydF4y2Ba(gydF4y2BaegydF4y2Ba) =gydF4y2BaxgydF4y2Ba我gydF4y2Ba.的gydF4y2Ba概率gydF4y2Ba关于这次事件,gydF4y2BaPgydF4y2Ba{gydF4y2BaXgydF4y2Ba=gydF4y2BaxgydF4y2Ba我gydF4y2Ba},本身是的函数gydF4y2BaxgydF4y2Ba我gydF4y2Ba,称为概率gydF4y2Ba分布函数gydF4y2Ba的gydF4y2BaXgydF4y2Ba.因此,随机变量的分布gydF4y2BaRgydF4y2Ba在上一节中定义的是函数gydF4y2Ba我gydF4y2Ba= 0, 1,…,gydF4y2BangydF4y2Ba用二项式表示gydF4y2Ba方程gydF4y2Ba.介绍符号gydF4y2BafgydF4y2Ba(gydF4y2BaxgydF4y2Ba我gydF4y2Ba) =gydF4y2BaPgydF4y2Ba{gydF4y2BaXgydF4y2Ba=gydF4y2BaxgydF4y2Ba我gydF4y2Ba},从概率的基本性质可以看出gydF4y2Ba方程。gydF4y2Ba而且gydF4y2Ba方程。gydF4y2Ba对于任何实数gydF4y2Ba一个gydF4y2Ba而且gydF4y2BabgydF4y2Ba.如果gydF4y2BaYgydF4y2Ba第二个随机变量是否定义在相同的样本空间上gydF4y2BaXgydF4y2Ba拿着gydF4y2Ba值gydF4y2BaygydF4y2Ba1gydF4y2Ba,gydF4y2BaygydF4y2Ba2gydF4y2Ba、……gydF4y2BaygydF4y2BangydF4y2Ba为二元函数gydF4y2BahgydF4y2Ba(gydF4y2BaxgydF4y2Ba我gydF4y2Ba,gydF4y2BaygydF4y2BajgydF4y2Ba) =gydF4y2BaPgydF4y2Ba{gydF4y2BaXgydF4y2Ba=gydF4y2BaxgydF4y2Ba我gydF4y2Ba,gydF4y2BaYgydF4y2Ba=gydF4y2BaygydF4y2BajgydF4y2Ba}被称为gydF4y2Ba共同分配gydF4y2BaXgydF4y2Ba而且gydF4y2BaYgydF4y2Ba.自{gydF4y2BaXgydF4y2Ba=gydF4y2BaxgydF4y2Ba我gydF4y2Ba} =∪gydF4y2BajgydF4y2Ba{gydF4y2BaXgydF4y2Ba=gydF4y2BaxgydF4y2Ba我gydF4y2Ba,gydF4y2BaYgydF4y2Ba=gydF4y2BaygydF4y2BajgydF4y2Ba},这个并集由样本空间中不相交的事件组成,gydF4y2Ba方程。gydF4y2Ba

经常gydF4y2BafgydF4y2Ba叫做gydF4y2Ba边际分布gydF4y2BaXgydF4y2Ba强调其与联合分布的关系gydF4y2BaXgydF4y2Ba而且gydF4y2BaYgydF4y2Ba.同样的,gydF4y2BaggydF4y2Ba(gydF4y2BaygydF4y2BajgydF4y2Ba) = ΣgydF4y2Ba我gydF4y2BahgydF4y2Ba(gydF4y2BaxgydF4y2Ba我gydF4y2Ba,gydF4y2BaygydF4y2BajgydF4y2Ba的(边际)分布gydF4y2BaYgydF4y2Ba.随机变量gydF4y2BaXgydF4y2Ba而且gydF4y2BaYgydF4y2Ba定义为独立的,如果事件{gydF4y2BaXgydF4y2Ba=gydF4y2BaxgydF4y2Ba我gydF4y2Ba}和{gydF4y2BaYgydF4y2Ba=gydF4y2BaygydF4y2BajgydF4y2Ba都是独立的gydF4y2Ba我gydF4y2Ba而且gydF4y2BajgydF4y2Ba即:,如果gydF4y2BahgydF4y2Ba(gydF4y2BaxgydF4y2Ba我gydF4y2Ba,gydF4y2BaygydF4y2BajgydF4y2Ba) =gydF4y2BafgydF4y2Ba(gydF4y2BaxgydF4y2Ba我gydF4y2Ba)gydF4y2BaggydF4y2Ba(gydF4y2BaygydF4y2BajgydF4y2Ba)gydF4y2Ba我gydF4y2Ba而且gydF4y2BajgydF4y2Ba.an的联合分布gydF4y2Ba任意的gydF4y2Ba随机变量数的定义类似。gydF4y2Ba

假设两个gydF4y2Ba骰子gydF4y2Ba被抛出。让gydF4y2BaXgydF4y2Ba表示出现在两个骰子上的数字之和,令gydF4y2BaYgydF4y2Ba表示出现偶数的数目。的可能值gydF4y2BaXgydF4y2Ba是2,3,…,12,而可能的值是gydF4y2BaYgydF4y2Ba是0 1 2。由于两个骰子有36种可能的结果,附带的表格给出了联合分布gydF4y2BahgydF4y2Ba(gydF4y2Ba我gydF4y2Ba,gydF4y2BajgydF4y2Ba) (gydF4y2Ba我gydF4y2Ba= 2,3,…,12;gydF4y2BajgydF4y2Ba= 0,1,2)和边际分布gydF4y2BafgydF4y2Ba(gydF4y2Ba我gydF4y2Ba),gydF4y2BaggydF4y2Ba(gydF4y2BajgydF4y2Ba)可通过直接枚举轻松计算。gydF4y2Ba

对于更复杂的实验,确定一个完整的概率分布通常需要结合理论gydF4y2Ba分析gydF4y2Ba而且gydF4y2Ba经验gydF4y2Ba实验往往是非常困难的。因此,最好是尽可能用少量的gydF4y2Ba参数gydF4y2Ba比较容易评估和解释。最重要的是gydF4y2Ba的意思是gydF4y2Ba和gydF4y2Ba方差gydF4y2Ba.它们都是根据随机变量的“期望值”来定义的。gydF4y2Ba

期望值gydF4y2Ba

给定一个随机变量gydF4y2BaXgydF4y2Ba与分布gydF4y2BafgydF4y2Ba的期望值gydF4y2BaXgydF4y2Ba,表示gydF4y2BaEgydF4y2Ba(gydF4y2BaXgydF4y2Ba),由gydF4y2BaEgydF4y2Ba(gydF4y2BaXgydF4y2Ba) = ΣgydF4y2Ba我gydF4y2BaxgydF4y2Ba我gydF4y2BafgydF4y2Ba(gydF4y2BaxgydF4y2Ba我gydF4y2Ba).的期望值gydF4y2BaXgydF4y2Ba的每一个可能值的和是gydF4y2BaXgydF4y2Ba乘以得到这个值的概率。的期望值gydF4y2BaXgydF4y2Ba也被称为gydF4y2Ba的意思是gydF4y2Ba关于分布gydF4y2BafgydF4y2Ba.的基本性质gydF4y2BaEgydF4y2Ba它是线性的吗gydF4y2BaXgydF4y2Ba而且gydF4y2BaYgydF4y2Ba随机变量和ifgydF4y2Ba一个gydF4y2Ba而且gydF4y2BabgydF4y2Ba都是常数gydF4y2BaEgydF4y2Ba(gydF4y2Ba一个gydF4y2BaXgydF4y2Ba+gydF4y2BabgydF4y2BaYgydF4y2Ba) =gydF4y2Ba一个gydF4y2BaEgydF4y2Ba(gydF4y2BaXgydF4y2Ba) +gydF4y2BabgydF4y2BaEgydF4y2Ba(gydF4y2BaYgydF4y2Ba).要了解为什么是这样,请注意gydF4y2Ba一个gydF4y2BaXgydF4y2Ba+gydF4y2BabgydF4y2BaYgydF4y2Ba本身是一个随机变量,它假设的值gydF4y2Ba一个gydF4y2BaxgydF4y2Ba我gydF4y2Ba+gydF4y2BabgydF4y2BaygydF4y2BajgydF4y2Ba有了概率gydF4y2BahgydF4y2Ba(gydF4y2BaxgydF4y2Ba我gydF4y2Ba,gydF4y2BaygydF4y2BajgydF4y2Ba).因此,gydF4y2Ba方程。gydF4y2Ba

如果右边的第一个和被求和gydF4y2BajgydF4y2Ba而持有gydF4y2Ba我gydF4y2Ba固定,由方程(gydF4y2Ba8gydF4y2Ba)结果是gydF4y2Ba问题7gydF4y2Ba根据定义gydF4y2BaEgydF4y2Ba(gydF4y2BaXgydF4y2Ba).类似地,第二个和等于gydF4y2BaEgydF4y2Ba(gydF4y2BaYgydF4y2Ba).gydF4y2Ba

如1[A]表示的“指标变量”gydF4y2Ba一个gydF4y2Ba即:,一个随机变量e问ual to 1 if一个gydF4y2Ba发生,否则等于0,则gydF4y2BaEgydF4y2Ba{1 (gydF4y2Ba一个gydF4y2Ba]} = 1 ×gydF4y2BaPgydF4y2Ba(gydF4y2Ba一个gydF4y2Ba) + 0 ×gydF4y2BaPgydF4y2Ba(gydF4y2Ba一个gydF4y2BacgydF4y2Ba) =gydF4y2BaPgydF4y2Ba(gydF4y2Ba一个gydF4y2Ba).这表明,期望的概念包括作为特殊情况的概率的概念。gydF4y2Ba

举例来说,考虑一下这个数字gydF4y2BaRgydF4y2Ba红色的球gydF4y2BangydF4y2Ba从装有比例的瓮中取出替换物gydF4y2BapgydF4y2Ba红球。从定义和gydF4y2Ba二项分布gydF4y2Ba的gydF4y2BaRgydF4y2Ba,gydF4y2Ba第八题gydF4y2Ba哪一个可以用代数运算来计算并相等gydF4y2BangydF4y2BapgydF4y2Ba.这种表示法更容易使用gydF4y2BaRgydF4y2Ba= 1 (gydF4y2Ba一个gydF4y2Ba1gydF4y2Ba] +⋯+ 1[gydF4y2Ba一个gydF4y2BangydF4y2Ba),gydF4y2Ba一个gydF4y2BakgydF4y2Ba表示gydF4y2Ba事件“The”gydF4y2BakgydF4y2Ba抽签的结果是一个红球。”自gydF4y2BaEgydF4y2Ba{1 (gydF4y2Ba一个gydF4y2BakgydF4y2Ba]} =gydF4y2BapgydF4y2Ba对所有gydF4y2BakgydF4y2Ba,由线性gydF4y2BaEgydF4y2Ba(gydF4y2BaRgydF4y2Ba) =gydF4y2BaEgydF4y2Ba{1 (gydF4y2Ba一个gydF4y2Ba1gydF4y2Ba]} +⋯+gydF4y2BaEgydF4y2Ba{1 (gydF4y2Ba一个gydF4y2BangydF4y2Ba]} =gydF4y2BangydF4y2BapgydF4y2Ba.这个论证说明了一个原则,即人们通常可以在不先计算随机变量的分布的情况下计算其期望值。再举一个例子,假设gydF4y2BangydF4y2Ba球被随意扔进gydF4y2BangydF4y2Ba盒子。空盒子的数量,gydF4y2BaYgydF4y2Ba,表示为gydF4y2BaYgydF4y2Ba= 1 (gydF4y2BaBgydF4y2Ba1gydF4y2Ba] +⋯+ 1[gydF4y2BaBgydF4y2BangydF4y2Ba),gydF4y2BaBgydF4y2BakgydF4y2Ba事件是“the ?gydF4y2BakgydF4y2Ba盒子是空的。”自gydF4y2BakgydF4y2Ba该方框是空的当且仅当gydF4y2BangydF4y2Ba球进了其中一个gydF4y2BangydF4y2Ba−1个盒子,gydF4y2BaPgydF4y2Ba(gydF4y2BaBgydF4y2BakgydF4y2Ba) = [(gydF4y2BangydF4y2Ba−1)/gydF4y2BangydF4y2Ba]gydF4y2BangydF4y2Ba对所有gydF4y2BakgydF4y2Ba,因此gydF4y2BaEgydF4y2Ba(gydF4y2BaYgydF4y2Ba) =gydF4y2BangydF4y2Ba(1−1/ .gydF4y2BangydF4y2Ba)gydF4y2BangydF4y2Ba.确切的分布gydF4y2BaYgydF4y2Ba非常复杂,尤其是如果gydF4y2BangydF4y2Ba很大。gydF4y2Ba

许多概率分布的值很小gydF4y2BafgydF4y2Ba(gydF4y2BaxgydF4y2Ba我gydF4y2Ba的极端值(或大或小)gydF4y2BaxgydF4y2Ba我gydF4y2Ba更大的值gydF4y2BafgydF4y2Ba(gydF4y2BaxgydF4y2Ba我gydF4y2Ba)供中介人使用gydF4y2BaxgydF4y2Ba我gydF4y2Ba.例如,表中的两个边际分布都是关于一个具有相对高概率的中点对称的,而当一个值远离中点时,其他值的概率就会减小。就分布而言gydF4y2BafgydF4y2Ba(gydF4y2BaxgydF4y2Ba我gydF4y2Ba)遵循这种模式,人们就可以解释的平均值gydF4y2BafgydF4y2Ba作为一个粗人gydF4y2Ba测量gydF4y2Ba大部分概率分布的位置,因为在定义和的值gydF4y2BaxgydF4y2Ba我gydF4y2Ba的大值相关gydF4y2BafgydF4y2Ba(gydF4y2BaxgydF4y2Ba我gydF4y2Ba)或多或少地界定了分布的中心。在极端情况下,是预期的gydF4y2Ba价值gydF4y2Ba的gydF4y2Ba常数gydF4y2Ba随机变量就是这个常数。gydF4y2Ba

方差gydF4y2Ba

同样有趣的是,要知道一个分布的平均值有多紧密。最重要的浓度度量是方差,用Var(gydF4y2BaXgydF4y2Ba),并由Var(gydF4y2BaXgydF4y2Ba) =gydF4y2BaEgydF4y2Ba{(gydF4y2BaXgydF4y2Ba−gydF4y2BaEgydF4y2Ba(gydF4y2BaXgydF4y2Ba)]gydF4y2Ba2gydF4y2Ba}。通过期望的线性,可以等效地得到Var(gydF4y2BaXgydF4y2Ba) =gydF4y2BaEgydF4y2Ba(gydF4y2BaXgydF4y2Ba2gydF4y2Ba)−{gydF4y2BaEgydF4y2Ba(gydF4y2BaXgydF4y2Ba)}gydF4y2Ba2gydF4y2Ba.的gydF4y2Ba标准偏差gydF4y2Ba的gydF4y2BaXgydF4y2Ba是gydF4y2Ba平方根gydF4y2Ba它的方差。它比方差有更直接的解释因为它的单位和gydF4y2BaXgydF4y2Ba.常数随机变量的方差为0。同样,如果gydF4y2BacgydF4y2Ba为常数,Var(gydF4y2BacgydF4y2BaXgydF4y2Ba) =gydF4y2BacgydF4y2Ba2gydF4y2BaVar (gydF4y2BaXgydF4y2Ba).gydF4y2Ba

随机变量乘积的期望没有一般公式。如果随机变量gydF4y2BaXgydF4y2Ba而且gydF4y2BaYgydF4y2Ba是独立的,gydF4y2BaEgydF4y2Ba(gydF4y2BaXgydF4y2BaYgydF4y2Ba) =gydF4y2BaEgydF4y2Ba(gydF4y2BaXgydF4y2Ba)gydF4y2BaEgydF4y2Ba(gydF4y2BaYgydF4y2Ba).这可以用来说明,如果gydF4y2BaXgydF4y2Ba1gydF4y2Ba、……gydF4y2BaXgydF4y2BangydF4y2Ba是独立的随机变量,方差的和gydF4y2BaXgydF4y2Ba1gydF4y2Ba+⋯+gydF4y2BaXgydF4y2BangydF4y2Ba为个体方差的和,Var(gydF4y2BaXgydF4y2Ba1gydF4y2Ba) +⋯+ Var(gydF4y2BaXgydF4y2BangydF4y2Ba).如果gydF4y2BaXgydF4y2BaS具有相同的分布且相互独立,均值(gydF4y2BaXgydF4y2Ba1gydF4y2Ba+⋯+gydF4y2BaXgydF4y2BangydF4y2Ba) /gydF4y2BangydF4y2BaVar (gydF4y2BaXgydF4y2Ba1gydF4y2Ba) /gydF4y2BangydF4y2Ba.同样的,标准gydF4y2Ba偏差gydF4y2Ba(gydF4y2BaXgydF4y2Ba1gydF4y2Ba+⋯+gydF4y2BaXgydF4y2BangydF4y2Ba) /gydF4y2BangydF4y2Ba的标准差是gydF4y2BaXgydF4y2Ba1gydF4y2Ba除以gydF4y2Ba的平方根gydF4y2Ba√gydF4y2BangydF4y2Ba.这量化了直观的概念gydF4y2Ba平均gydF4y2Ba重复观测的变量小于单个观测的变量。更准确地说,它说平均的可变性与观测数量的平方根成反比。这一结果在求解gydF4y2Ba统计推断gydF4y2Ba.(gydF4y2Ba看到gydF4y2Ba一节gydF4y2Ba大数定律,中心极限定理,泊松近似gydF4y2Ba.)gydF4y2Ba

再次考虑由方程(gydF4y2Ba3.gydF4y2Ba).在计算平均值时,可以使用定义结合一些代数操作来表明,如果gydF4y2BaRgydF4y2Ba为二项分布,则Var(gydF4y2BaRgydF4y2Ba) =gydF4y2BangydF4y2BapgydF4y2Ba问gydF4y2Ba.从表示法gydF4y2BaRgydF4y2Ba= 1 (gydF4y2Ba一个gydF4y2Ba1gydF4y2Ba] +⋯+ 1[gydF4y2Ba一个gydF4y2BangydF4y2Ba]的定义,以及事件的观察gydF4y2Ba一个gydF4y2BakgydF4y2Ba是独立的,有相同的概率,是这样吗gydF4y2Ba方程。gydF4y2Ba

此外,gydF4y2Ba方程。gydF4y2Ba所以Var (gydF4y2BaRgydF4y2Ba) =gydF4y2BangydF4y2BapgydF4y2Ba问gydF4y2Ba.gydF4y2Ba

的条件分布gydF4y2BaYgydF4y2Ba鉴于gydF4y2BaXgydF4y2Ba=gydF4y2BaxgydF4y2Ba我gydF4y2Ba定义为:gydF4y2Ba方程。gydF4y2Ba

(gydF4y2Ba比较gydF4y2Ba式(4)),和gydF4y2Ba条件期望gydF4y2BaYgydF4y2Ba鉴于gydF4y2BaXgydF4y2Ba=gydF4y2BaxgydF4y2Ba我gydF4y2Ba是gydF4y2Ba方程。gydF4y2Ba

我们可以认为gydF4y2BaEgydF4y2Ba(gydF4y2BaYgydF4y2Ba|gydF4y2BaXgydF4y2Ba的函数gydF4y2BaXgydF4y2Ba;自gydF4y2BaXgydF4y2Ba这个函数是随机变量吗gydF4y2BaXgydF4y2Ba必须是一个随机变量。条件期望gydF4y2BaEgydF4y2Ba(gydF4y2BaYgydF4y2Ba|gydF4y2BaXgydF4y2Ba)被认为是一个随机变量,它有自己的(无条件的)期望gydF4y2BaEgydF4y2Ba{gydF4y2BaEgydF4y2Ba(gydF4y2BaYgydF4y2Ba|gydF4y2BaXgydF4y2Ba)},由式(9)乘以gydF4y2BafgydF4y2Ba(gydF4y2BaxgydF4y2Ba我gydF4y2Ba),然后求和gydF4y2Ba我gydF4y2Ba得到重要的公式gydF4y2Ba方程。gydF4y2Ba

恰当地解释,式(10)是总概率定律的推广。gydF4y2Ba

举一个使用公式(10)的简单例子,回想一下赌徒破产的问题gydF4y2BaegydF4y2Ba(gydF4y2BaxgydF4y2Ba)gydF4y2Ba表示gydF4y2Ba如果Peter的财产一开始等于gydF4y2BaxgydF4y2Ba.由式(5)和式(10)推导可知gydF4y2BaegydF4y2Ba(gydF4y2BaxgydF4y2Ba)满足方程gydF4y2BaegydF4y2Ba(gydF4y2BaxgydF4y2Ba) = 1 +gydF4y2BapgydF4y2BaegydF4y2Ba(gydF4y2BaxgydF4y2Ba+ 1) +gydF4y2Ba问gydF4y2BaegydF4y2Ba(gydF4y2BaxgydF4y2Ba−1)forgydF4y2BaxgydF4y2Ba= 1, 2,…gydF4y2Ba米gydF4y2Ba−1带有边界条件gydF4y2BaegydF4y2Ba(0) =gydF4y2BaegydF4y2Ba(gydF4y2Ba米gydF4y2Ba) = 0。解决方案gydF4y2BapgydF4y2Ba≠1/2比较复杂;为gydF4y2BapgydF4y2Ba= 1/2,gydF4y2BaegydF4y2Ba(gydF4y2BaxgydF4y2Ba) =gydF4y2BaxgydF4y2Ba(gydF4y2Ba米gydF4y2Ba−gydF4y2BaxgydF4y2Ba).gydF4y2Ba