登录| 注册    
收藏  点赞 

回归

分析变量间依存关系的统计方法。按变量间内在联系的动态趋势和变量数目,可分直线回归、曲线回归和多元线性回归。实践中常常需要从一个变量的变化来推测另一个变量的具体变化。尤其是对难于直接度量性状的推测,例如种猪的瘦肉率,需将猪屠宰后进行肉脂剥离才能获得。但可利用回归方程从有关性状量的变化来加以估测。直线回归分析两变量间呈线性依存关系的一种统计方法。

分析变量间依存关系的统计方法。按变量间内在联系的动态趋势和变量数目,可分直线回归、曲线回归和多元线性回归

实践中常常需要从一个变量的变化来推测另一个变量的具体变化。尤其是对难于直接度量性状的推测,例如种猪的瘦肉率,需将猪屠宰后进行肉脂剥离才能获得。但可利用回归方程从有关性状量的变化来加以估测。

直线回归

分析两变量间呈线性依存关系的一种统计方法。有直线线性关系的两性状间的变量,用一个变量的变化来估测另一个变量的具体变化时,方程通式为:

回归

式中 x为自变量;为依变量y的估计值,也称回归值;a为回归线在y轴上的截距,即x=0时的值;b为回归线的斜率,在统计上称回归系数,表示x变动一个单位时,平均变动的单位数。

直线回归方程的配合

根据最小二乘原理从两变量实际观察值,由式(2)、式(3)求方程中a和b值,此时离回归平方和,即估计误平方和最小。

回归

式中 SSx为x的离均差平方和,SPxy为两变量的离均差乘积和,n为样本含量。为y变量的均数,为x变量的均数。

直线回归方程的显著性检验

目的是判定样本所在总体是否存在回归关系。方法有三种:

F检验

回归

将求得的F值查方差分析用F界值表,确定其P值,按所取检验水准(α)作出推断结论。

t检验

回归

式中 β为总体回归系数;Sb为回归系数标准误;Sy.x为y依x的离回归标准误(估计误标准误),

回归

将求得t值查t界值表,确定其p值,按所取检验水准(α)作出推断结论。这里因df1=1,t=

求相关系数r

用r的查表法检验代替b的检验。

直线回归与相关的关系

直线回归与直线相关是研究两变量间直线关系的两种统计方法。相关反映相互关系,回归反映依存关系。直线相关用相关系数r说明直线关系的方向和密切程度。直线回归用直线回归方程描述两变量变化的数量关系。两种方法虽有区别,但又有联系。由同一资料计算的r和b正负号相同,即正相关时b值为正,负相关时b值为负,零相关时b值为零。r与b的数学式可以相互转换,如y依x的回归系数:

回归

x依y的回归系数:

回归

式中 Sx,Sy为x、y的标准差

两变量的相关系数恰是正反两个回归系数的几何均数:

回归

在应用上,因r与b显著性检验是一致的,而r的检验,用查表法即可确定,较为方便,故常用以代替b的检验。同时,r2或|r|值又是分析回归效果的重要统计指标,可衡量由回归方程估测y的准确性。所以,一般在作直线回归分析前,要先求r,在r显著的基础上,且r2或|r|较高的情况下再作回归方程的计算。若r2或|r|值过小,这样的回归方程无实际应用意义。

两直线回归方程的比较

样本直线回归方程经显著性检验,认为存在直线关系后,方可与其他直线方程进行比较,判断有无差别。决定直线回归方程的参数是回归系数和截距,所以回归方程间比较需进行两个b之间和两个a之间的差异显著性检验

当这两参数经检验差异均不显著时,可认为两直线重合,两样本回归系数相同,截距也相等,因此可将两样本原始数据合并求总直线回归方程,统一描述两变量间的回归关系。

曲线回归

分析两变量间呈曲线依存关系的一种统计方法。要确定x、y两变量内在关系的曲线函数类型,一般可根据专业知识,从理论推测或过去经验来确定;或利用一些数学坐标纸绘制成点图,从散点分布图形特点选定。再计算所配曲线方程的未知数。然后对所配曲线回归关系作显著性检验。并对所配曲线作拟合度分析。

常用曲线根据配合方法可分两类:一类为能直线化曲线,如指数曲线、对数曲线等,可用曲化直法,先通过变量变换,使曲线变直线后,再按直线回归处理;另一类为多项式曲线,如抛物线,可将曲线公式化为多元线性方程,再按多元线性回归处理。

能直线化的曲线回归

曲线的化直法是根据具体方程,先将x、y两变量用对数变换、倒数变换或其他变换,使原来方程化为直线方程,按直线方程处理求未知参数。曲线方程的未知参数可由曲线化直方程参数作反变换求得(图1)。

直线化的曲线回归方程的显著性检验,可利用对曲化直回归方程的检验来完成。若该方程成立,则曲线关系也成立,反之亦然。

方程的拟合度分析,包括拟合度的测定和比较。

曲线配合的拟合度测定

曲线配合好坏,即所配曲线与实际观察数据拟合的情况,可由离回归平方和占y总变异的比例的互补值,即相关指数(R2)来表示:

回归

R2愈接近1,表示拟合得愈好。这里必须由曲线方程算得估计值,而不能用变换后的值。这里的符号用R2而不用r2,以示区别。R2的平方根也可称为相关系数,但它并非变量变换后的线性相关系数。

能直线化曲线配合的拟合度比较

同一组双变量资料,如果呈现某种非线性回归关系,而总体的数学函数形式尚未确定时,常常可用几个不同的方程估计总体,再比较不同方程的拟合度,进行选择。它们的比较用F检验

多项式曲线回归

多项式曲线的一般形式为:

回归

若令x1=x,x2=x2,x3=x3,…,xm=xm,则多项式曲线方程可化成多元线性方程:

回归

图1 能直线化的曲线方程及图形

图2 二次曲线

图3 三次曲线

多元线性回归方法(见多元线性回归)计算曲线回归方程中的各未知参数(b0,b1,b2,…,bm),进行显著性检验和拟合度测定。

常用的二次、三次曲线方程的图形见图2、图3。二次曲线也称二次抛物线,三次曲线也称三次抛物线。随着方程方次升高,曲线形状趋复杂,计算趋繁。必要时可采取逐步增加方次,至拟合最优为止。原始数据观察点极少时,拟合方程方次不能太高,否则由于自由度太小而无实际意义。