登录| 注册    
收藏  点赞 

农作物产量多级系统(对称)抽样调查(mul-tistage systematic sampling survery in crop vield)

反之,在第一层为较大的数,其余各层也为较大的数。这就是顺序排队用一般系统抽样法所产生的系统误差。为了改正这个缺点,要求第一层正排列(由左到右),第二层反排列(由右到左),再按各层左端等距布点,如图(b)所示。第一层为2133,第二层为50027,两层的样本单位大小搭配。大小搭配的作用

概率抽样的一种综合设计。中国农村调查长期应用划类选典法,统计工作者结合实际情况吸收概率抽样的做法运用了这种调查方法。

多级抽样

①由各省(自治区、直辖市)分别抽县,县抽乡,乡抽村队(或组),组抽地块或农户,地块抽实割实测点。级数的多少可根据实际情况确定。各级抽样时,以系统(对称)抽样法为主(地块抽实割实测点则按一般系统抽样法)。系统(对称)抽样法要求抽取的样本单位关于双层(第一、第二两个层,第三、第四两个层等)之中点为对称。以北京市某县某乡1977~1979年按播种面积计算的粮食平均每亩产量排队,结合播种面积,抽出7个队(组)为例,说明对称系统抽样法的排队及抽样方法。本法先将各队(组)按3年(1977~1979)粮食平均每亩产量由低到高排队编号,结合各队(组)三年粮食平均播种面积,依次计算累计播种面积(如表),以造成线性关系。②计算每层长度k,作为分层及取样的依据。每层长度k=总播种面积N÷样本单位数n=182560÷7=26080。③层数确定后,在第一层随机抽取第一个样本单位,其所在位置为i。本例随机数i=2133。在表中由累计面积确定,由于本方法采取样本单位关于双层之中点为对称的原则,第二层抽取的样本单位为2k-i=2×26080-2133=50027,i=2133,与2k-i=50027,二者是关于点26080为对称。对称系统抽样如图(a)所示。同样,第三层所抽取的样本单位为2k+i,第四层为4k—i等。取样的一般算式为2ck±i,i为在第一层随机抽取数,其符号从第二层起依次为-、+、-、+……,k为每层长度(抽样距离),c为确定层次的参数,从第二层起依次为1、1、2、2、3、3……。

北京市某县某乡1977~1979年按播种面积计算粮食平均每亩产量排队

系统(对称)抽样法的特点

①运用辅助信息或有关标志(三年粮食平均每亩产量或上年每亩产量排队),以提高抽样效果。在基层抽选地块时,如果有当年目测估产资料,则抽样效果更好,如辅助信息X1(上年亩产)与所研究现象y1(本年亩产)相关,会大大减少抽样误差。因此,对有关标志除根据已有知识外,还要进行相关分析,计算出相关程度的大小,即相关系数,以测定所研究现象的精确度。在农作物产量调查中,辅助信息用前三年平均数还是用上年数,从理论上讲,辅助信息只提供各样本单位每亩产量间之比,并不由此得出本年指标的大小。况且根据大量计算,用上年数计算的相关系数与三年平均数的差别不大。在计算上,前三年平均较为复杂,而上年数不仅符合近期指标起主要作用的设想,也可简化计算手续。②引进播种面积,加强了随机性,突出了不等概率。由于本方法是按每亩产量结合播种面积排队的,计算每层长度k不是按每亩产量的顺序号数,而是取决于播种面积。由于播种面积为连续变量,用系统抽样法重复抽取样本时,有大量样本可供抽取,增强了样本的随机性。随着概率科学的发展,不等概率在抽样误差上的应用,赋予随机样本以更广泛的意义。本方法由于引进播种面积而具有这一优点。不等概率在推算总体单产时还具有加权作用。③以排队论为依据,对称随机抽取样本。如果按每亩产量高低排队,每隔k个抽取一个样本单位。由于系统抽样的特点,当第一层的抽样单位一经确定,其余各层的样本单位就完全确定了。现在随机数如为较小的数2133,则第二层的样本单位数所在位置为26080+2133=28213,也为较小的数。反之,在第一层为较大的数,其余各层也为较大的数。这就是顺序排队用一般系统抽样法所产生的系统误差。为了改正这个缺点,要求第一层正排列(由左到右),第二层反排列(由右到左),再按各层左端等距布点,如图(b)所示。第一层为2133,第二层为50027,两层的样本单位大小搭配。大小搭配的作用,在系统抽样误差的一种公式中表现得更为明显。

农作物产量多级系统(对称)抽样调查

大小搭配可以造成公式中的样本内的相关系数ρω为负数,使抽样误差大为缩小。这种抽样法的布点,也可改为容易接受的正排列形式,如图(a)及取样代数式所示,而不失去其性质。另外,从取样代数式2ck±i还可证明各样本单位具有非常强的代表性,例如第一、第二两层,样本单位所在位置可以证明适在第一层中点,也在第二层中点,这是因为在第一层随机抽取的i,与第二层样本单位2k-i的和为i+2k-i=2k。而第一层中位数为,第二层中位数为,二者之和也为=2k,其余对应层亦同。这样不仅形成对称概念,且与各层的平均数很接近,使抽样误差大大减少。如果层次为奇数,则在最后一层取中位数。以上是关于双层中点为对称的取样法。也可用关于全序列中点为对称的取样法,二者结果大致相同,但前者较后者便于计算。④多级系统(对称)抽样误差。系统(对称)抽样法重视各总体单位的大小在抽样中的作用,因此,设计抽样误差时要用不等概率。由于不放回不等概率具有数学与计算上的困难,致使其发展受到影响。同时,在多级抽样中第一级误差占很大比重,为了减少计算上的困难,不等概率也可只要求在第一级误差上使用。也可这样设想,每层只抽一个单位,不用单位的大小,而用层的长度k作为权数,也是合理的。由于每层的长度相同,则在抽样中可用等概率求抽样误差。由于抽样误差的估计式,可采用折层法计算估计抽样误差的方法。这是因为系统(对称)抽样法,实质上是把两层作为一个大层,适于用折层法计算估计抽样误差。⑤按行政系统分级(阶段)抽样,可以适应抽中的各级政府的需要。对组织调查来说,分级抽样可以克服由中央直接编制抽样框的困难,且便于分级抽取样本,监督抽样调查工作,充分利用有关单位的人力,节省费用。此外,系统(对称)抽样,合乎均匀分布样点的原则,又简便易行,容易为工作人员和群众所接受。

本调查是以一定辅助资料为前提设计的,如果基层不具备条件,需经上级批准才能改用一般系统抽样法或其他随机抽样法。