登录| 注册    
收藏  点赞 

PPS抽样

抽取概率与单元大小成正比的抽样方法。是典型的不等概抽样。单元大小由选定的辅助因子值限定,其值愈大,被抽中的概率愈高。辅助因子应与目标因子成过原点的紧密正相关。PPS样本值通常大于常规等概抽样的样本值。在总体变动大、低值单元较多时,PPS抽样效率更高。简史1943年韩生(M.H.Hansen)和胡威地(W.W.Hurwity)首先提出PPS抽样方法。奥地利的毕特利希(W.

抽取概率与单元大小成正比的抽样方法。是典型的不等概抽样。单元大小由选定的辅助因子值限定,其值愈大,被抽中的概率愈高。辅助因子应与目标因子成过原点的紧密正相关。PPS样本值通常大于常规等概抽样的样本值。在总体变动大、低值单元较多时,PPS抽样效率更高。

简史

1943年韩生(M.H.Hansen)和胡威地(W.W.Hurwity)首先提出PPS抽样方法。奥地利的毕特利希(W.Bitterlich)于1948年创立的角规测树方法,自发地应用了PPS原理。在他提出的水平角规绕测中,林木被抽中概率与其胸高断面积成正比(见角规测树)。1955年,美国格罗森堡(L.R.Grosenbaugh)指出了角规的PPS抽样原理,使角规进一步用于其他因子的估测方面。3P抽样的出现使PPS抽样更易于实施。

类型

根据辅助因子和其取值手段的不同,可将林业上常用的PPS抽样方法分为三类:①角规点抽样和线抽样(见角规测树);②3p抽样:取总体各单元辅助变量的预估值,以此进行PPS抽样;③列表抽样:将总体各单元辅助变量列成清单,对它进行PPS抽样,这三类方法中,列表抽样是最基本的方法,角规抽样和3P抽样是PPS抽样的变型。

方法

包括样本抽取和总体估测两方面的内容。

①样本抽取

PPS抽样属重复抽样。其效率取决于样本组织技术,关键在于选择合适的辅助变量作为抽样概率的依据。概率因子应与目标因子成正比,并且有详尽的总体各单元数据。森林调查的目的变量常为蓄积量,在应用PPS抽样时应采用与蓄积量成正相关的变量作为辅助因子。常用的是林分面积、林木胸高断面积等因子。如果选用的概率变量与目的变量成负相关,样本中目的因子值必低,其效率反不如等概抽样。列表抽样的程序是将概率变量的数值和累计值按总体单元列表。例如:以林分作单元,在230个林分中进行PPS抽样。利用航空象片判读总体每个林分的蓄积量,以它为概率变量,将每个林分的判读蓄积和累计蓄积列表如下:

林分判读蓄积和累计蓄积登记表

表中,230个林分的判读总蓄积量为141450立方米。以累计总值作为上限,利用随机数字表抽取随机数字,设抽出数为1702。由表中累计值项中查出此值落在第四号林分中,四号林分的区间为1701至3330。凡在这个区间内的随机数字均为抽中第四号林分。显然,判读蓄积量大的林分有较大的抽中概率。第i个林分的抽中概率Pi为其判读蓄积量与总体累计值之比。第四号林分抽中概率为1630/141450。依此抽取一定数量的林分作为样本。

森林调查有时按小班面积进行PPS抽样。具备森林分布图时可不列表,而直接在图上用网点膜片抽取样点,样点落入的小班即是被抽中小班。面积大的小班,样点落入的概率大,相同小班有再次抽中的可能。

②总体估测

测定抽中单元,取得目的变量的观测值yi。估测总体时,样本中每个单元需具备两个数据,即抽取概率pi和yi。PPS样本需用抽取概率pi,对目的变量值yi作概率改算。总体总量估计值为

PPS抽样

实际计算时,可以简化为

PPS抽样

式中 x为第一个抽中单元的概率变量值;x为总体概率变量的总值;n为PPS样本单元数。以小班面积作为概率变量时,x即为第i个抽中单元的小班面积;y为其目的变量,即蓄积量的观测值;x为森林总体的总面积。目的变量改算时,采用yx的比值方法。样本中,每个单元的比值为r,样本中各单元比值的平均值为。总体总量估计值为

PPS抽样

总体总量估计值的方差为

PPS抽样

比值平均数的方差为

PPS抽样

评价

PPS抽样方法的优点是:它能发挥已有信息的作用,并且把已有信息作为概率变量提高了抽样效果;采用比值平均数估计,比值越稳定,效率愈高;在抽样过程中完成了单元大小不同的权重问题,称为自权重,数据处理中不必再加权,简化了估计方法。但PPS抽样方法有一定的局限性:对概率因子要求高,要求概率因子与目的变量成正比,且应具备每个单元的数据;抽中单元较大,实测工作量大。

(董乃钧)