假设检验

假设测试是一种形式统计推断它使用来自样本的数据来得出关于总体的结论参数或者一个种群概率分布.首先,对参数或分布。这个假设被称为零假设并且表示为H0.一个替代假设(表示H一个),这与零假设中陈述的相反,然后定义。假设检验程序包括使用样本数据来确定是否H0可以被拒绝。如果H0被拒绝,统计结论是替代假设H一个是真的。

例如,假设一家电台选择播放的音乐是基于听众的平均年龄为30岁的假设。为了确定该假设是否有效,可以对所给出的原假设进行假设检验H0: μ = 30,供择假设为H一个: μ≠30。根据听众中的个人样本,样本的平均年龄,,可以计算并用于确定是否有足够的要拒绝的统计证据H0.从概念上讲,样本均值“接近”于30的值与原假设一致,而样本均值“不接近”于30的值则为备择假设提供支持。什么被认为是“接近”和“不接近”是由使用抽样的分布

理想情况下,假设检验程序导致接受H0H0是真的和拒绝了吗H0H0是假的。不幸的是,由于假设检验是基于样本信息的,因此必须考虑误差的可能性。一个I型错误对应于拒绝H0H0是正确的,而a第二类错误对应于接受H0H0是假的。的概率制造I型的方法错误表示由α表示,出现第二类错误的概率用β表示。

在使用假设检验程序来确定是否应该拒绝原假设时,进行假设检验的人指定了犯第一类错误的最大允许概率,称为测试的显著性水平。通常选择显著性水平为α = 0.05和α = 0.01。尽管假设检验的大多数应用控制了犯第一类错误的概率,但它们并不总是控制犯第二类错误的概率。一个被称为可以构造操作特征曲线来显示样本量的变化如何影响犯第二类错误的概率。

一个概念被称为p-value为在假设检验应用中得出结论提供了方便的依据。的p-value是一个度量样本结果的可能性,假设零假设为真;越小p-value表示样本结果的可能性越小。如果p-value小于α,则可拒绝原假设;否则,零假设不能被否定。的p-value通常被称为测试观察到的显著性水平。

可以对其进行假设检验参数一个或多个种群以及在各种其他情况下。在每种情况下,该过程都从null和alternative的表述开始假设关于人口。除了总体平均值之外,假设检验程序还可用于总体参数,如比例、方差标准差,中位数

在回归和相关分析中还进行了假设检验,以确定回归关系和相关系数是否具有统计学意义(见下文)回归与相关分析).一个拟合优度检验是指零假设为总体具有特定概率分布(如正态概率分布)的假设检验。非参数统计方法还涉及各种假设检验程序。

贝叶斯方法

统计方法推理以前所描述的常被称为经典的方法。贝叶斯方法(得名于英国数学家托马斯·贝叶斯)提供选择这使得人们可以结合关于人口的先验信息参数用样本中包含的信息来指导统计推断过程。一个首先指定感兴趣的参数的先验概率分布。然后通过应用程序获得和组合样本信息贝叶斯定理提供参数的后验概率分布。后验分布为统计提供了依据推论关于参数。

贝叶斯方法的一个关键且有点争议的特征是总体参数的概率分布概念。根据经典统计学,参数是常数,不能表示为随机变量。贝叶斯的支持者认为,如果一个参数值是未知的,那么指定一个描述参数及其可能值的概率分布是有意义的可能性.贝叶斯方法允许使用客观数据或主观意见来指定先验分布。使用贝叶斯方法,不同的个体可能指定不同的先验分布。经典统计学家认为,由于这个原因,贝叶斯方法缺乏客观性。贝叶斯的支持者认为,经典的统计推断方法具有内在的主观性(通过抽样计划的选择),贝叶斯方法的优点是主观性是明确的。

贝叶斯方法在统计学中得到了广泛的应用决策理论(见下文决策分析).在这个上下文,贝叶斯定理提供了一种机制,将自然状态的先验概率分布与样本信息结合起来,以提供关于自然状态的修正(后验)概率分布。这些后验概率被用来做出更好的决策。