利用样本资料对总体的某些性质进行估计或判断,获得总体有关信息的统计学方法。农业气象试验、观测或调查所得的数据资料总是有限的、有一定随机性,由它们统计分析出的规律或结论是否能代表真实情况,其可靠性如何
利用样本资料对总体的某些性质进行估计或判断,获得总体有关信息的统计学方法。农业气象试验、观测或调查所得的数据资料总是有限的、有一定随机性,由它们统计分析出的规律或结论是否能代表真实情况,其可靠性如何,均需要通过统计推断作出估计或判断。
即确定总体参数较好的估计量及构造一定概率条件下总体参数的置信区间。①估计量。根据样本估计总体参数(如数学期望方差、线性相关系数等)时,一般要用样本资料构造一个估计量。例如估计一个正态总体的数学期望,常把样本平均值作为估计量,或把样本最大值与最小值的平均值用为估计量。对一个总体参数,往往可有很多个估计量,从中确定一个较好的估计量近似地看作总体参数,称为参数的点估计。所谓较好的估计量,指它的分布集中在参数真值附近。若其数学期望正好等于被估计的参数值,则称为无偏估计量。当样本容量不断增加时,如果估计量与被估计参数值之差大于任意一常数的概率可以任意小,则称它是相容的。如果估计量包含样本中有关被估计参数的全部信息,则称它是充分的。②估计方法。构造估计量进行参数点估计的方法很多:矩估计法是通过假设前n阶的样本矩等于总体的矩,然后解出这个总体的参数。它无须知道总体分布类型,但它只能估计与矩有关的参数;最小二乘法、方差法、最小X2法等是以参数的估计使样本与被估计参数偏差平方的某个线性函数达到最小为基础的;贝叶斯方法是用抽样前参数可能值的分布和样本观测数据一起构造一个估计量;最大似然法则是用使样本的概率为最大的参数值作为估计量的。一般说来,它可以估计比较复杂的参数,但它要求知道总体分布的类型。区间估计是构造一个置信区间,使被估计的参数在一定概率(1-α)下包含在此区间内。而此给定的概率称作区间的置信水平或置信概率。α称为置信度,简称信度。例如:对于服从N(μ1σ)分布的随机变量x,若σ已知,样本平均值为,则有
统计推断
其中x±1.96σ为确定的区间为置信区间,1-α=0.95为置信水平,α=0.05为置信度。如涉及到同时估计若干个总体参数,其置信区间可推广为置信区域,置信水平则是该区域实际包含这些参数的真值的次数所占的比例。
又称统计假设检验,指先对研究对象总体参数或分布类型(如正态分布等)做出某种假设,然后用实际样本资料经过一定的统计处理,检验假设是否合理。前者为参数假设检验,后者为非参数假设检验。从只判断假设是否成立,做出拒绝或接受假设的结论这个角度又称为显著性检验。假设检验的基本理论依据是实际推断原理中的小概率原理:概率α很小的事件,在一次观测中认为是实际不可能出现的。假设检验的基本思路是,首先根据问题的要求作出原假设H0;然后构造一个统计量Ω使它反映出样本与总体的差异。又能在原假设H0成立时服从某种已知的分布,其分布密度函数为φ(ω);若给定一个置信度α(例如,α=0.05、0.01等),就可以确定一个相应的置信限ωα及临界区间(或称否定域)Rα。在H0成立条件下,存在P(ΩeRα)=α;由样本资料计算出统计量Ω的具体值ω,如ωeRα,落于置信区间外,意味着一个小概率事件在一次观测中竟然出现了,这与实际推断原理矛盾,因而认为原假设H0不合理,应拒绝(否定)。反之,如ω不属于Ra,落于置信区间内,则符合实际推断原理,可以认为原假设H0是合理的,应予接受(肯定)。当然,上述结论都是在一定概率意义下得出的,有可能犯错误。若原假设H0为真,检验后把它拒绝了,就犯了“以真作假”的第一类错误,其犯错误的概率就是给定的α;若原假设H0为假,检验后把它接受了就犯了“以假作真”的第二类错误,其犯错误的概率为β,α与β之间存在一定的关系,当样本容量一定时,要减小α,会增大β,反之亦然。同时减小两者是不可能的,除非增加样本容量。要根据实际问题的要求选择适当的α和β。
各种类型的假设检验,在实用中的区别在于,根据问题要求构造不同的统计量。常见的有u检验、t检验、F检验、符号检验、秩和检验以及游程检验等类型。
所有评论仅代表网友意见