统计数据
我们的编辑器将检查你提交并决定是否修改这篇文章。
读这一主题的简要总结
统计数据,科学的收集、分析、展示和解释数据。政府需要人口普查数据和信息的各种经济活动提供了很多早期的动力场的统计数据。目前需要把大量数据可用在许多应用领域转化为有用的信息刺激都在统计理论和实践的发展。
数据收集的事实和数据,进行了分析,并总结报告和解释。可分为定量或定性数据。定量数据测量多少钱或多少的东西,和定性数据提供标签,或者名字,等类别的物品。例如,假设一个特定的研究感兴趣的特征,比如年龄、性别、婚姻状况、和年收入100人的样本。这些特征会叫这项研究的变量,数据每个变量的值将与每个人有关。因此,数据值28,男,单身,和30000美元将被记录为一个28岁的单身男性年收入为30000美元。有100个人和4个变量,数据集100×4 = 400件。在这个例子中,年龄和年收入是定量变量;相应的数据值显示多少年和为每个单独的多少钱。性别、婚姻状况是定性变量。标签性别,男性和女性提供定性数据和标签单身,结婚,离婚,丧偶表示婚姻状况。
抽样调查方法被用来从观测研究收集数据,和实验设计方法用于从实验研究收集数据。描述性统计的面积是主要关心的方法使用图表,展示和解释数据表和数字摘要。每当从sample-i.e统计学家使用数据。,a subset of the population—to make statements about a population, they are performing统计推断。估计和假设检验程序被用来做统计推论。卫生保健等领域,生物学,化学,物理、教育、工程、商业和经济学充分利用统计推理。
的方法概率最初开发的吗分析的赌博游戏。概率统计推断中扮演着重要角色;它是用来提供措施的质量和精度的推论。许多统计推断是本文中描述的方法。这些方法主要用于变量研究,而其他的,如回归和相关分析,是用来推断两个或两个以上变量之间的关系。
描述性统计
描述性统计数据表格、图形和数值数据的总结。描述性统计的目的是促进数据的表示和解释。大部分的统计报告出现在报纸和杂志在本质上是描述性的。单变量的描述性统计方法使用数据增强一个变量的理解;多元方法专注于使用统计信息来理解两个或两个以上变量之间的关系。为了说明描述性统计的方法,前面的示例中,数据被收集在年龄、性别、婚姻状况、和100人的年收入将检查。
表格的方法
最常用的表格为一个变量是一个总结数据频率分布。频率分布显示数据值的数量在每个几个不重叠的类。另一个表格汇总,称为相对频率分布,显示了分数,或百分比在每个类的数据值。最常见的表格汇总数据为两个变量两变量交叉制表模拟频率分布。
定性变量,频率分布显示数据值的数量在每个定性分类。例如,性别变量两类:男性和女性。因此,性别会有两个不重叠的类频率分布显示男性和女性的数量。这个变量的相对频率分布显示个人的分数,是男性和女性个人的分数。
构建一个频率分布定量变量在定义类和部门需要更多的关心点之间相邻类。例如,如果上面的示例的年龄数据从22到78年不等,以下六个不重叠的类可以使用:为20 - 29、30—39、40至49,50-59,60 - 69,70 - 79。频率分布的数量将显示数据值在每个类,和相对频率分布显示数据值的分数。
交叉制表是一个双向表与表的行代表一个变量的类和表列代表另一个变量的类。构建交叉制表使用变量性别和年龄,性别可以用两行显示,男性和女性,和年龄可能有六列对应于类为20 - 29岁- 39、40至49,50-59,60 - 69,70 - 79。表的每个单元中的条目将指定数量的数据值的性别年龄行标题和列标题的。这种交叉制表可以有助于理解性别和年龄之间的关系。
图形化方法
大量的图形方法可用来描述数据。一个条形图是一个用于描述定性数据的图形设备频率分布进行了总结。标签的类别定性变量的水平轴图所示。酒吧在每个标签了,这样每个栏的高度成正比的数据值的类别。条形图的婚姻状况100个人在上面的示例中所示 。图中有四条,一个用于每个类。一个饼状图是另一个图形设备总结定性数据。每个块的大小的饼图数据的数量成正比值在相应的类中。饼图显示了100个人的婚姻状况 。
一个柱状图是最常见的图形演示定量数据总结了在频率分布。定量变量的值显示在水平轴上。绘制一个矩形上面每一个类,这样的类矩形的宽度等于间隔和它的高度成正比的数据值。