暨南大學(xué)劉建平教授主持完成的國家社會科學(xué)基金項目《輔助信息在抽樣調(diào)查中的應(yīng)用模型與方法研究》(批準號為04BTJ013),最終成果為專著《輔助信息在抽樣調(diào)查中的應(yīng)用模型與方法》。課題組成員有:陳光慧。
當今社會已經(jīng)步入信息時代,人們每天都面對著海量的數(shù)據(jù)和信息。無論是國家對經(jīng)濟社會的宏觀管理,還是處于社會再生產(chǎn)各個環(huán)節(jié)的投資者、生產(chǎn)者和消費者以及各種中介機構(gòu)的微觀管理;無論是有效地生產(chǎn),還是高質(zhì)量地生活,抑或科學(xué)地研究,都需要獲取和利用大量、及時和有效的信息。社會對信息的依賴和需求日益增大,人們對有效獲取信息的手段和方法愈來愈重視。面對海量的信息,如何有效地獲取和利用信息是統(tǒng)計工作的一項基本任務(wù)。作為統(tǒng)計調(diào)查主體方法的抽樣調(diào)查,由于在獲取信息中所具有的獨特優(yōu)勢而得到越來越廣泛的重視和應(yīng)用。一項大中型抽樣調(diào)查能否獲得成功,很大程度上依賴于抽樣調(diào)查中對輔助信息利用得好壞。
一、該成果的主要內(nèi)容和重要觀點 1.研究思路與方法路徑。該成果的研究思路與方法可歸納為兩條路徑。路徑一:兩個階段→一個目標→兩個標準。兩個階段是指輔助信息在抽樣調(diào)查中的應(yīng)用主要體現(xiàn)在抽樣設(shè)計和抽樣估計兩個階段;一個目標是指如何充分利用現(xiàn)實中各種類型的輔助信息進行抽樣設(shè)計和估計量設(shè)計,構(gòu)造出一個精度更高的估計量;兩個標準指的是評價抽樣設(shè)計和估計量優(yōu)劣的兩個依據(jù):一個是構(gòu)造的估計量要滿足無偏性、有效性、一致性和充分性等統(tǒng)計性質(zhì)的要求,另一個是要能給出估計量的方差及其估計量的計算公式。這是該項成果的整體研究思路。路徑二:超總體回歸模型→有限總體回歸模型→樣本回歸模型。傳統(tǒng)的抽樣調(diào)查將總體看成是固定的,隨機性僅表現(xiàn)在樣本的抽取,估計推斷以抽樣設(shè)計為基礎(chǔ)。該成果把有限總體看成是超總體的一個隨機實現(xiàn),把超總體回歸模型作為研究的工具,是一種基于模型的模型輔助估計方法。它首先研究如何充分利用現(xiàn)有的各類輔助信息設(shè)計超總體回歸模型,其次研究如何估計超總體回歸模型的參數(shù)。如果掌握有限總體的數(shù)據(jù),就依據(jù)有限總體的數(shù)據(jù)估計出超總體回歸模型參數(shù)的估計值 ,進而給出估計量的方差;實際調(diào)查中,一般并不掌握有限總體的數(shù)據(jù),這時就運用概率樣本數(shù)據(jù)進行估計,估計出超總體回歸模型參數(shù)的樣本估計值,進而得到方差的估計量。這是該成果在估計量設(shè)計階段利用輔助信息的主要方法路徑。
2.提出在普查基礎(chǔ)上科學(xué)編制抽樣框是在我國統(tǒng)計調(diào)查方法體系中真正確立普查基礎(chǔ)地位和抽樣調(diào)查主體地位的關(guān)鍵,給出了編制基礎(chǔ)抽樣框和操作抽樣框以及對名錄庫進行更新維護的思路和方法。
3.建立了抽樣調(diào)查的基礎(chǔ)概念體系。它是構(gòu)建輔助信息在抽樣調(diào)查中應(yīng)用模型和方法體系的基礎(chǔ)。這些基礎(chǔ)概念包括抽樣設(shè)計、樣本示性變量、包含概率、量、量的方差及其估計量。這些概念相互之間邏輯關(guān)系緊密,對于抽樣從設(shè)計到估計的全過程起著基礎(chǔ)的和基本的作用。抽樣設(shè)計是研究包含概率、量及其相關(guān)統(tǒng)計性質(zhì)的基礎(chǔ)。在有限總體中,抽樣設(shè)計確定了,包含概率和量也就隨之確定了。不同的抽樣設(shè)計,給出不同的包含概率,最終也使量具有不同的形式。量是在抽樣設(shè)計下得到的一般性估計量,量具有的統(tǒng)計性質(zhì)能很容易推廣到具體抽樣設(shè)計下的不同情形。樣本示性變量的定義和優(yōu)良特性使包含概率、量及其統(tǒng)計性質(zhì)的推導(dǎo)簡潔方便。該成果的研究內(nèi)容是以包含概率和量為基礎(chǔ)的。
4.建立了輔助信息在抽樣設(shè)計中應(yīng)用的模型與方法體系。該成果分別對等概率抽樣設(shè)計中的伯努力抽樣、簡單隨機抽樣、系統(tǒng)抽樣和不等概率抽樣設(shè)計中的泊松抽樣、樣和樣如何利用輔助信息提高抽樣效率進行了系統(tǒng)深入的研究,比較了各種方法對輔助信息的利用程度及其效率。特別是給出了樣本量大于2時樣設(shè)計下方差估計的一種簡便算法,使樣的應(yīng)用不再局限于樣本量小于等于2的情形,給出了在MPPS抽樣下利用輔助信息對Hansen-Hurwitz估計量進行擴展的方法,解決了多目標抽樣下估計量整體估計精度不高的問題。比較好地解決了如何在分層抽樣設(shè)計中利用輔助信息分配樣本、選擇分層標志、確定分層界限和層數(shù)的問題,探討了利用輔助信息尋求多目標分層抽樣的最優(yōu)設(shè)計方法。系統(tǒng)研究了在整群抽樣設(shè)計和二階抽樣設(shè)計中應(yīng)用不同類型輔助信息的基本條件和方法,對兩種方法的抽樣設(shè)計效應(yīng)以及影響效應(yīng)大小的因素進行了深入的分析研究。
5.建立了輔助信息在抽樣估計中應(yīng)用的模型與方法體系。該成果所用的抽樣推斷方法是模型輔助估計。這種方法只是把超總體回歸模型作為一種輔助工具,而不是依賴超總體模型進行估計,不管模型是否會出現(xiàn)設(shè)定誤差,都不會直接影響到回歸估計量基本統(tǒng)計性質(zhì)的成立。在抽樣估計階段,要利用已知的輔助變量提高抽樣估計的精度,關(guān)鍵在于建立反映輔助變量與研究變量之間關(guān)系的回歸模型。所以,該研究成果專門研究了如何根據(jù)獲得的輔助信息的不同類型,建立恰當?shù)胤从齿o助變量與研究變量之間關(guān)系的超總體回歸模型,從而最大限度地提高各種回歸估計量的精度。首先研究了如何由一般的超總體回歸模型推導(dǎo)出GREG估計量,對GREG估計量的統(tǒng)計性質(zhì)進行了嚴格的推導(dǎo)證明。其次,根據(jù)輔助變量與研究變量之間具體的回歸關(guān)系,對一般的超總體回歸模型所得出的結(jié)論加以推廣,建立比率模型、線性回歸模型、事后分層回歸模型和非參數(shù)回歸模型,分別推導(dǎo)出比率估計量、線性回歸估計量、事后分層回歸估計量和非參數(shù)回歸估計量,并研究相應(yīng)的估計量性質(zhì)。從而建立起一個較為完整的抽樣估計方法體系。
6.建立了輔助信息在抽樣設(shè)計與估計量設(shè)計中同時應(yīng)用的模型與方法體系。為了更加充分地利用已有的輔助信息,盡可能地提高抽樣估計的精度,該成果將抽樣設(shè)計與估計方法作為一個整體,研究了利用一種或多種輔助信息同時改進抽樣設(shè)計和估計量設(shè)計的模型和方法。把抽樣設(shè)計階段的分層抽樣和抽樣估計階段的比率估計、回歸估計結(jié)合起來進行研究,使輔助信息在分層抽樣設(shè)計和比率估計與回歸估計中同時得到應(yīng)用;研究了如何利用不同種類的輔助信息在整群抽樣設(shè)計和二階抽樣設(shè)計下進行回歸估計,對整群抽樣設(shè)計效應(yīng)進行了更深入的討論,對分層整群抽樣回歸模型與事后分層整群抽樣回歸模型進行了系統(tǒng)的研究;研究了如何利用輔助變量進行二重分層抽樣、二重回歸估計以及二重分層回歸估計,即在二重抽樣下同時考慮分層抽樣設(shè)計和使用回歸估計方法,實現(xiàn)從抽樣設(shè)計和估計方法兩個層面同時提高二重抽樣的估計精度。
7.輔助信息在抽樣調(diào)查其他環(huán)節(jié)中應(yīng)用的模型與方法。該研究成果圍繞抽樣設(shè)計和估計量設(shè)計這兩個關(guān)鍵,對輔助信息在相關(guān)課題中的應(yīng)用模型和方法也進行了研究,具體包括輔助信息在域估計、樣本輪換和無回答中的應(yīng)用。從滿足多層次推斷和多級管理的需要出發(fā),分別研究了輔助信息在域估計中的直接估計和間接估計的應(yīng)用模型和方法。研究了在樣本輪換中分別以前期樣本資料為輔助信息的量,同時以前期樣本資料及全面資料為輔助信息的回歸估計量,同時以前期樣本資料和全面資料為輔助信息的校準估計量。研究了處理無回答的加權(quán)調(diào)整法和插補法,提出了校準加權(quán)調(diào)整法,這種方法綜合了加權(quán)調(diào)整法和插補法兩者的優(yōu)點,更充分地利用了已有的輔助信息,從而更多地減少了由于無回答的存在給估計帶來的精度損失。
二、研究成果的學(xué)術(shù)和社會價值 1.建立了輔助信息在抽樣調(diào)查中應(yīng)用的模型和方法體系。該成果在系統(tǒng)總結(jié)前人研究成果的基礎(chǔ)上,對輔助信息在抽樣調(diào)查中各個環(huán)節(jié)的應(yīng)用模型與方法進行系統(tǒng)研究,建立了輔助信息在抽樣調(diào)查中的應(yīng)用模型和方法體系。這也有利于從事抽樣調(diào)查實踐的人員運用該研究成果對抽樣實踐進行指導(dǎo),從而提高我國抽樣調(diào)查的方法技術(shù)水平,提高抽樣調(diào)查的效率和效益。
2.在若干方面取得突破性進展,解決了抽樣方法中存在的一些難題。給出樣本量大于2時樣下方差估計的一種簡便算法,解決了二階包含概率不易計算的難題,拓展了樣的應(yīng)用范圍;給出了MPPS抽樣下,利用輔助信息對Hansen-Hurwitz估計量進行擴展的方法,解決了多目標抽樣下估計量整體精度不高的難題。通過輔助變量的最小值和最大值進行線性轉(zhuǎn)化改進比率估計量,給出在不同條件下選用有效估計量的標準;在比率模型和線性回歸模型中考慮異方差問題,針對不同的方差結(jié)構(gòu),給出相應(yīng)的估計方法;將事后分層作為估計方法研究,根據(jù)定性和定量的輔助信息分別建立事后分層回歸模型;根據(jù)輔助變量與研究變量之間的非參數(shù)回歸關(guān)系建立非參數(shù)回歸模型等等,開辟了抽樣估計方法研究的新領(lǐng)域。
(責(zé)編:陳葉軍)