残留分析

残差分析验证回归模型中起着重要的作用。如果错误项回归模型满足前面提到的四个假设,模型被认为是有效的。以来的统计测试意义也基于这些假设,结论造成这些意义测试质疑如果假设关于ε并不满意。

th的区别是残余的因变量观测值,y和预测的价值估计回归方程,ŷ。这些残差,计算从可用的数据,被视为模型的估计误差,ε。因此,他们使用的统计学家验证假设关于ε。良好的判断力和经验中扮演关键的角色剩余分析。

图形化的情节和统计检验残差由统计人员仔细检查,根据这些检查和判断。最常见的残图所示ŷ水平轴和垂直轴上的残差。如果假设关于误差项,ε,感到满意,剩余的情节将包括一个水平带点。如果剩余分析并不表明,模型假设感到满意,它经常建议的方法模型可以被修改以获得更好的结果。

模型建立

在回归分析中,模型建立的过程中开发一种概率模型,最好的描述了依赖和独立变量之间的关系。主要的问题是寻找合适的形式(直线或曲线)的关系和选择独立变量包括。在构建模型通常需要使用定性以及定量变量。

如上所述,定量变量测量多少钱或多少;定性变量代表类型或类别。例如,假设它是感兴趣的预测销售的冰茶瓶或罐。显然,自变量可能影响因变量“容器类型的销售。”然而,容器类型是一个定性变量,必须指定的数值如果要用于回归研究。所谓的虚拟变量是用来表示定性变量的回归分析。例如,哑变量x可以用来表示容器类型通过设置x= 0,如果冰茶瓶和包装x= 1,如果冰茶可以。如果饮料可以放在玻璃瓶,塑料瓶,或罐头,它需要两个虚拟变量的正确表示定性变量容器类型。一般来说,k- 1虚拟变量需要模型可能承担的定性变量的影响k值。

一般线性模型y01x12x2+。+βpxp+ε模型可用于各种曲线依赖和独立变量之间的关系。例如,每个独立变量可能是非线性的函数其他的变量。同时,统计学家有时发现有必要将因变量,以构建一个满意的模型。对数转换是更常见的类型之一。

相关

相关性和回归分析都相关,处理变量之间的关系。相关系数是衡量两个变量之间的线性相关性。值之间的相关系数总是−1和+ 1。+ 1表示两个变量的相关系数是完全以一种积极的线性相关的意义上,−1表明,两个变量的相关系数是负的线性意义完全相关,相关系数为0,表明没有两个变量之间的线性关系。为简单线性回归,样本相关系数平方根确定系数的符号相关系数是相同的标志b1的系数x1在估计的回归方程。

回归和相关分析都不能被解释为建立因果关系。他们只能显示或在多大程度上变量如何相互关联。相关系数的措施只有两个变量之间的线性关系的程度。任何结论关于因果关系的判断必须基于分析师。

时间序列预测

时间序列是一个收集的数据的连续时间点或连续一段时间。一个月新屋开工数据序列和一系列每周产品销售数据时间序列的例子。通常在一个时间序列的数据收集在等距的一段时间,比如小时,天,周,月,或者一年。

时间序列分析的主要关心的是发展的预测未来值的系列。例如,联邦政府发展等许多经济时间序列的预测国内生产总值(gdp)出口,等等。大多数公司开发产品销售的预测。

而在定性和练习定量预测方法利用、统计预测方法采用定量方法。两个最广泛使用的预测方法Box-Jenkins自回归综合移动平均(ARIMA)和计量经济学模型。

是基于一个假设,即ARIMA方法概率模型生成时间序列数据。未来的时间序列值被认为是有关过去的价值观以及过去的错误。一个时间序列必须静止的,即。,一个一个常数的意思是,方差自相关函数,为了一个适用的ARIMA模型。对于非平稳的系列,有时连续值之间的差异可以被用作固定系列的ARIMA模型可以应用。

经济计量模型发展的预测时间序列可能使用一个或多个相关时间序列和过去的时间序列值。这种方法涉及到开发一个回归模型的时间序列预测因变量;相关时间序列以及过去的时间序列值独立或预测变量。

非参数方法

上述统计方法普遍关注