Werden wir Helden für einen Tag

Home | About | Archive

你玩統計,統計玩你 #2

Posted on Mar 17, 2014 by Chung-hong Chan

「六成合格」成為某文的重要理據,指平均分不能反映現實。除了 The Suffocated 指出有高達 280 人 (即 28% ) 給 50 分這個數額的問題,另一個非常重要的問題是這個六成數額是未經加權的。 HKUPOP 收回來的數據也有一般固網電話調查的問題,回應人士女的比男多,當中又以中、老年人士比率較人口普查結果為多 ((這是因為師奶常在家中,故此也較常被訪。這是非常常見的現象。)) ,這也是調查為何要加權的原因。

   gp pass   n percentage     weight
1  11   41  86   47.67442 0.09010102
2  12   20  50   40.00000 0.07671513
3  13   31  57   54.38596 0.08966764
4  14   53  87   60.91954 0.09445608
5  15   46  72   63.88889 0.05444945
6  16   42  69   60.86957 0.05279413
7  21   39  75   52.00000 0.10338122
8  22   35  65   53.84615 0.10873688
9  23   77 120   64.16667 0.11441989
10 24   84 134   62.68657 0.09735534
11 25   85 125   68.00000 0.05287130
12 26   58  73   79.45205 0.06505191

gp 第一個字是性別 , 1 是男 2 是女,而第二個數字是年齡組,分別是 (1 = 18 至 29, 2 = 30 至 39, 3 = 40 至 49, 4 = 50 至 59, 5 = 60 至 69 , 6 = 70 或以上 ) 。從上表可見,男士普偏評分的合格率低。整體而言,又以年紀較低的組群合格率低。
如上述六成以上合格率是未經加權,如果要加權,方法很簡單就是 sum(percentage * weight) 。最終得出的數字係:

58.13%

嗱,未夠 60% !
你可能會話,挑,四捨五入之後不就是 60% 嗎?
那麼, HKUPOP 給出的平均分 47.5 ,四捨五入之後不都也是 50 嗎? 為何又會有人大造文章?
另一個令我不解的問題是何以只針對 HKUPOP ?
香港其實有另一所大學有研究民意,她是中文大學亞太研究所( HKIAPS ,行內簡稱「亞太所」)的電話調查研究室。她們是用近乎一樣的問題去問特首評分,與 HKUPOP 的分別是她們只在月中調查,故此只一個月發表一次。假如我將亞太所的結果和 HKUPOP 的結果配對一起,可以得出以下圖表。

trend

兩者的升降幾乎是同步。 ((兩機構結果的差異可歸因於樣本誤差 sampling error )) 兩所機構所得評分的 correlation 高達 0.904 。 ((這個只是 crude estimate ,因為兩者是 time series ,有 auto correlation 因素,是應該先行 prewhiten 才計算 correlation 。)) 到底是兩所機構同樣不科學,還是兩所機構的方法太科學所以能夠互相複製 (reproduce) 對方的結果?
如果反對 HKUPOP 的人士真的只針對 HKUPOP 的研究方法,那麼他們都應開動傳媒機器炮轟同樣「不科學」的中大亞太所,才是公道。


Powered by Jekyll and profdr theme