第壹,統計誤差的分類
顧名思義,誤差是指壹個量的觀測值或計算值與其真值之間的差異;統計誤差,即反映客觀現象的量由於測量、計算或觀察過程中的某些誤差或通常由於某些不可控因素而偏離標準值或規定值的量。有哪幾種統計誤差?
1.根據統計誤差的性質,分為四種:空間誤差、時間誤差、方法誤差和人為誤差。
空間誤差是指統計調查範圍造成的誤差,包括統計調查單位重復漏項和跨區域統計;
時間誤差是指對統計調查對象的時期或時間點界定不準確而產生的誤差。比如,企業核算時間造成的誤差不能滿足統計部門報表制度的要求;因延長或縮短周期而造成的誤差;周期錯位等引起的誤差。
方法誤差是由於使用特定的統計調查方法而引起的誤差。例如,抽樣調查中的代表性誤差(抽樣平均誤差)是指抽樣調查方法中使用隨機樣本(不完全單位)計算總體所產生的誤差的平均值,而不是絕對統計誤差。對於代表性誤差,可以根據樣本的組織方法和容量計算平均誤差。而且通過擴大抽樣規模或優化調查的組織方法。再比如統計部門人力、物力、財力等資源不足導致的誤差,導致上報渠道不暢通,統計調查不充分,計算方法不科學、不規範。
人為誤差是指在統計設計、調查、整理、匯總和計算過程中,由於人為失誤而造成的誤差。人為誤差是統計誤差中產生因素最多的壹類,分為測量誤差、知識誤差、姿態誤差和幹擾誤差。計量誤差是指統計指標的計量或從產量到價值的轉換所產生的誤差。知識誤差是指統計人員由於統計知識不足,對統計指標含義不理解或誤解的誤差;態度錯誤是指統計人員對統計工作不負責任,隨意填寫統計數據而造成的錯誤,包括亂報、漏報或不按規定的計量單位填寫;幹擾誤差是指統計對象或統計部門在壹定利益的驅動下,虛報、漏報、編造統計數據而產生的誤差。
2.統計誤差按工作環節分為三種:來源誤差、中間環節誤差和最終誤差。來源誤差是指申報單位或申請人產生的誤差;中間環節誤差是指統計調查數據逐級上報過程中產生的誤差,包括加工、整理、匯總、計算等環節;最終誤差是指下級通過數據匯總或標準化方法得到的估計數據與最終使用數據之間的差異。按工作環節分類的統計誤差類別是相對的,中間環節誤差在不同場合可能是來源誤差,也可能是最終誤差。源誤差在某些場合也稱為調查誤差或登記誤差。
二、對統計誤差的壹些認識
1.宏觀統計誤差是客觀存在的,不以人的意誌為轉移。統計部門的任務是盡量減少統計誤差。比如測量誤差,比如人的身高,早晚不壹致,不同的調查單位由於質量和標準不同,必然會產生誤差。另壹個例子是空間誤差。在實際統計過程中,由於社會經濟現象的復雜性,不可能覆蓋所有調查單位產生的誤差。再舉壹個通俗的例子,菜販可能買了100斤蔬菜,零售後加起來可能是98斤,也可能給蔬菜潑水買了102斤,這充分說明了統計誤差的客觀存在。
2.目前,我國統計基礎薄弱,統計數據質量不能高估,壹些統計指標的誤差還相當大。統計部門要制止“黃坡買瓜自吹自擂”,壹定要有緊迫感。記得有壹位香港統計專家曾經指出“中國統計就像建在沙漠裏的房子”,意思是基礎不牢。比如GDP核算,全國數據和各省匯總數據有很多差距。各市收集的數據和省級也有很大差距。據說有些省份的差異率高達30%,如果算上“前50板”,誤差率也達到15%。再比如1998全國GDP增速7.8%,而全國只有少數省份低於7.8%,各省加權平均增速近15。
3.規劃和各種績效考核對統計數據的幹擾不容小覷。有興趣可以統計壹下GDP增長高於甚至超過計劃的比例,可能相當高。這並不是說規劃部門的方案準確合理,而是統計數據真的被打亂了。當然,幹擾數據不壹定是各級領導造成的,而是統計部門或方法不規範造成的。比如我市某鄉鎮幾年來建設和新建的水稻種植面積是壹致的,和考核指標是驚人的。
4.統計工作不是在“真空”中成長的,統計數據也受到黨風、社會風氣、法制風氣和各種命令的影響,統計部門無法完全控制統計誤差。比如統計源數據或原始憑證是財務核算或業務核算數據,在這個環節出現錯誤,僅僅依靠統計部門是遠遠不夠的。
5.統計誤差與投入的人力、財力密切相關。現在上級統計部門總是在增加統計調查任務,不顧基層的承受能力,導致數據質量嚴重下降,統計職業道德有“腐朽”的危險。所謂“事情最終都會解決”和“越難統計越好做”都說明了這些。
6.在統計工作中,估算應該具有合法的地位。在進行抽樣調查的過程中,我們壹般采用點估計,實際上是利用樣本的平均值來計算的。這本身就是壹個代表性的誤差,應該在誤差控制範圍內允許適當的調整,以保證歷史數據的平滑性。在統計守法方面,政府統計部門及其統計人員往往是最大的違法者,日常統計工作中存在大量的估算成分。比如基層報需要估計,基層數據不合邏輯需要調整,這些都是統計法規沒有保障的。好在統計部門在遵紀守法中既是運動員又是裁判員。因此,應在統計工作科學化、規範化的基礎上允許進行必要的估算,並在統計法中明確賦予綜合統計部門這壹權利。
7.統計部門要有科學的態度,不能玩數字遊戲,不能褻瀆統計法賦予的“權威”。第壹,不應對每壹項工作敷衍了事,要有求真務實的精神和精品意識。目前普查工作涉嫌過度,數據質量不高,基層政府財政苦不堪言,但普查數據對地方經濟建設或決策作用不大;二是沒有人力、財力、物力的許可,不能安排和實施新的統計項目,如計算鄉鎮壹級的國內生產總值;第三,要用好抽樣調查。有的地方為了考核鄉鎮的政績,從每個鎮整體抽取10戶登記(不超過總數的1%)計算農民純收入。顯然代表性誤差很大,人為造假更方便;第四,基層政府統計部門的人員配備只能應付數據收集和處理的任務。對社會經濟運行的分析研究不是統計部門的優勢。要揚長避短,不要顧此失彼。沒有準確的統計數據,就不可能有高質量的統計分析,光寫數據是徒勞的。
8.關註“富者藏貧”的統計現象。許多富裕地區沒有充分反映社會和經濟的發展。在反映總量指標的時候,他們隱藏了很多,他們說“留有余地”。而且在反映增長率的時候,他們玩的是“橡皮筋”遊戲,靈活性很好。他們想放慢速度報幾個單位,又想加快速度挖掘更多有潛力的單位。在經濟基礎薄弱的貧困地區,人們有強烈的“追趕”意識,他們盡力利用統計中的“盲點”來提高經濟總量和發展速度。如果他們收集不到詳細的統計數據,就會在規模以上工業總產值和農業產值上做文章,加工品按總值計算。
三、統計部門在縮小統計誤差方面應做的工作。
1.在統計設計中,需要補救登記錯誤,建立所謂的“測謊儀”系統。源數據質量問題統計部門往往把責任推給被調查者,有壹種無奈感。比如農業普查是按戶籍進行的,農民不能也不敢如實申報,大部分應該是漏報。在實際普查過程中,事後質量抽查的實質就是“測謊儀”。不幸的是,許多普查機構對這壹聯系不夠重視。表面調查完成後,他們覺得大功告成。對這壹階段的工作敷衍了事,不敢暴露問題,工作開展不深入。往往誤差幾乎為零,使得這個環節紮紮實實的走過場,結果可想而知。比如農普的畜牧業生產數據與原始統計數據相差甚遠,以哪個為準就沒有說服力。還應建立“測謊”制度,否則調查誤差將永遠是統計數據質量的“瓶頸”。“測謊”系統應建立必要的指標體系和評估方法,並廣泛使用數理統計中的假設檢驗方法。
2.必須有完善的指標體系及其計算方法。目前總結國民經濟核算體系,速度的計算方法不夠重視,五花八門,無所適從。而且到目前為止,過去壹起使用的不變價格法和價格指數消去法都不明確。甚至專業統計和綜合平衡統計的計算方法完全不同,甚至省市兩級的計算方法也不壹樣,公布速度也不壹樣,造成了不良的社會影響。
3.在抽樣調查中,應從上、下兩個層次抽取不同的樣本,對整體單位較少的整體不應采取抽樣調查。使用上下兩級的同壹樣本,最容易受到人為幹擾,尤其是統計部門為保持數據的連續性而進行的各種“技術性”調整。抽樣調查在國家和省壹級大規模推廣的積極作用毋庸置疑,但在地市級並不是“急功近利”。舉個例子,如果壹個縣拿3-5個單位來統計全縣餐飲業零售額,誤差和人為因素可想而知。因此,統計部門應在分析整體分析後選擇調查方法。
4.統計系統必須徹底改變。今後,國家和省級正常的統計任務應以三次調查為調查骨幹,不應逐級上報。市、縣及縣以上統計機構的統計任務應服務於當地黨政領導的決策,基本統計內容可以統壹,但應賦予更大的主動性。
5.加強統計執法,確保源數據的準確性。基層統計部門應在今後加強統計信息化工程建設的基礎上跳出數據采集的怪圈,重點加大統計執法檢查力度,堅決嚴厲查處弄虛作假單位,並在立法上加大罰款額度,以震懾統計違法者,逐步建立全社會的統計誠信體系。