登录| 注册    
收藏  点赞 

相关

分析变量间相互关系的统计方法。按变量数目,可分为简单相关、多元相关和组内相关。按内在联系的趋势及估计方法,简单相关又分直线相关、等级相关和曲线相关(见回归);多元相关又分偏相关和复相关。直线相关分析两变量相互间线性关系的一种统计方法。当一个变量x由小到大,另一个变量y也相应地由小到大(或由大到小),两变量的相关交点图形呈直线趋势,则这两变量间有直线关系。

分析变量间相互关系的统计方法。按变量数目,可分为简单相关、多元相关和组内相关。按内在联系的趋势及估计方法,简单相关又分直线相关、等级相关和曲线相关(见回归);多元相关又分偏相关和复相关。

直线相关

分析两变量相互间线性关系的一种统计方法。当一个变量x由小到大,另一个变量y也相应地由小到大(或由大到小),两变量的相关交点图形呈直线趋势,则这两变量间有直线关系。如母畜体重与仔畜初生重间有母大仔大,母小仔小的正向直线趋势;又如乳牛的产奶量与乳脂率间有产奶量高乳脂率低,产奶量低乳脂率高的负向直线趋势。

相关系数

度量两变量x和y间直线相关的性质(方向)和密切程度的统计指标,也称单位相关系数。它是两变量共同变异量〔协方差(covxy)〕与两变量自身变异量〔标准差(Sx·Sy)〕乘积的比值,或者说是标准化的协方差。

r的值在-1到+1之间,没有单位。当x由小到大,同时y也相应由小到大,则r值为正,称正相关;反之若y相应由大到小,则r值为负,称负相关;若x,y呈完全确定的函数关系,各交点都在直线上则r=1,或r=-1,称完全相关;若x的大小同y的大小无一定规律,或非线性关系时,则这时r=0,称零相关。生物现象,由于影响因素较多,很少呈完全相关。

相关指数

也是度量两变量直线相关密切程度的统计指标,它是r的平方,表示为r2

相关指数r2为两变量相关部分(回归部分)占总变异的比率。比率愈大,线性相关愈密切。可见用r2衡量两变量的相关程度要比r更合理。但r2不能确定线性相关的方向和性质。r2值的范围在0与1之间。

相关系数的显著性检验

目的是确定样本相关系数是否来自ρ=0的双变量总体,以判定两变量间是否存在直线相关。检验的最简便方法是查r值表。

相关系数的比较

对求得的r,只有经检验,认为有相关后,才能根据其符号及绝对的大小判定两变量的性质和相关程度的强弱,然后将它与其他相关系数作比较。对相关系数的比较也应作差异的显著性检验

等级相关

也称秩次相关。相关系数只适用于双变量正态分布资料,不适于非正态分布资料,或以等级表示数量大小的资料。对于这些资料,一般可用非参数法的等级相关法来分析。最常用的为斯皮尔曼(Spear-man)等级相关法。

多元相关

也称复相关。为分析多个变量间线性相关关系的一种统计方法。在多元线性相关分析中,变量有三个或更多。变量间的相关关系可分偏相关及复相关。

偏相关系数

也称净相关系数,它是在固定和排除其他变量影响的情况下,说明某两变量间相关程度和方向的统计指标。例如有三个变量x1,x2,x3相互相关,在排除x3的影响后x1与x2的相关系数,即x1与x2的偏相关系数,记作r12·3。如有四个变量,在固定排除x3、x4的影响后x1与x2的相关系数,即x1与x2的偏相关系数,记作r12·34。r12·3叫做一级偏相关系数,r12·34叫做二级偏相关系数,还有三级、四级……偏相关系数。所以有时简单相关系数也称零级偏相关系数。偏相关系数可由简单相关系数组成的相关矩阵的逆阵元素求得。

偏相关系数(rij.),同简单相关系数一样,可以是正值,也可以是负值,其绝对值在0~1之间。但偏相关系数与简单相关系数在数值上可相差很大,有时甚至符号相反。多变量情况下,两变量间的简单相关数往往不能正确说明两变量间的真正关系,只表示两变量间的表面关系,只有用排除其他变量影响的偏相关系数才能显示出两者的真正本质关系。偏相关系数的显著性检验也可用查r表法来进行。

复相关系数是依变量y的实际观察值与所配多元线性回归方程所估计值间的相关系数。一般根据回归变异占总变异的比值求之(R)。

R愈大,说明依变量y与各自变量总的线性关系愈密切,由这些自变量配合的线性回归方程估计y的准确度就愈高。复相关系数为正值。复相关系数比任一自变量与依变量y的简单相关系数绝对值都大,因此用多元线性回归方程来估计y,要比用任一自变量的简单回归方程来估计的准确度都高。

复相关系数的显著性检验可用F检验来进行。R的检验也可用查R值表法。

复相关指数

复相关系数的平方定义为复相关指数。同相关指数r2的原理一样,它是各自变量引起的变异在依变量总变异中所占的比率。所以用R2衡量线性相关的程度,衡量由多元回归方程估计依变量的准确度,要比用R更合理。

组内相关

也称同类相关,为分析多个同类变量间相关性的统计方法。利用分组试验资料方差分析所得的组间变异量和组内变异量可以度量组内相关。组内相关系数定义为组内方差与总方差之比。也就是组间变异量在总变异中所占的比率。在总变异中,组间变异相对大时,组内变异就相对小,即组内相关相对大。组内相关系数常用于遗传学中的同胞相关、重复率遗传力的估计。r1的显著性由资料方差分析F值作F检验,也可估计出组内相关的标准误,然后进行t检验。在数量遗传学中习惯使用后者。t检验一般较F检验更严格。