不少人都有看主場新聞的立法會選舉勝算分析,但我覺得這個所謂勝算分析太過 ballpark ((外文 ballpark figure 是指隨便估計的數字,但我認為也可以照字面解,是細路仔玩泥沙)) 。原因有三:

1. 其勝算只建基於一個時間點的民調結果
2. 「五五波」的定義不清
3. 「勝算」不是百分比

由於以上原因,我決定要挑戰這個主場新聞「勝算分析」,推出陳電鋸「勝算分析」 ((最少我的方法要解決了以上三個問題)) 。
我知沒有太多人想知我是怎樣做到,先講結果,有興趣人士才看看下面附上的方法論。大約的方法是用電腦模擬,就像模疑舉行了五千次選舉,再計算各候選人獲得幾多席。
我暫時只計算了港島區的結果。我會更新這個 Post ,再加上其他區的結果。

港島區

cand name prob
10 10 陳家洛 4953
12 12 曾鈺成 4904
8 8 葉劉淑儀 4868
2 2 單仲偕 4653
4 4 劉嘉鴻 3732
7 7 何秀蘭 3729
3 3 勞永樂 2850
9 9 王國興 2589
5 5 鍾樹根 1149
17 10 陳淑莊 790
13 13 劉健儀 681
15 2 楊森 98
14 14 吳文遠 2
16 8 黃楚峰 2
1 1 許清安 0
6 6 吳榮春 0
11 11 何家泰 0

九龍西

cand name prob
5 5 蔣麗芸 4940
6 6 黃毓民 4867
2 2 黃碧雲 4707
9 9 毛孟靜 4360
8 8 梁美芬 4266
3 3 譚國僑 1811
10 5 葉傲冬 38
11 6 嚴達明 10
12 8 楊永杰 1
1 1 黃以謙 0
4 4 黃逸旭 0
7 7 林依麗 0

九龍東

cand name prob
1 1 梁家傑 4933
6 6 陳鑑林 4925
2 2 黃國健 4684
5 5 胡志偉 4028
7 7 謝偉俊 3097
8 8 黃洋達 2745
3 3 陶君行 435
11 6 黎榮浩 103
10 1 譚文豪 50
4 4 嚴鳳至 0
9 9 譚香文 0

新界西

cand name prob
16 16 譚耀宗 4999
7 7 郭家麒 4990
11 11 梁耀忠 4969
4 4 陳偉業 4852
8 8 田北辰 4825
15 15 李卓人 4795
14 14 李永達 4719
2 2 麥美娟 3989
20 16 龍瑞卿 3086
17 7 余若薇 1250
3 3 陳樹英 1187
1 1 梁志祥 811
12 12 陳恒鑌 361
19 11 黃潤達 153
18 8 張慧晶 7
6 6 曾健成 3
10 10 陳一華 3
5 5 麥業成 0
9 9 何君堯 0
13 13 陳強 0

新界東

cand name prob
1 1 梁國雄 4957
3 3 劉慧卿 4957
9 9 陳克勤 4903
13 13 田北俊 4903
15 15 湯家驊 4525
10 10 張超雄 4190
7 7 陳志全 3278
6 6 葛珮帆 3193
2 2 葉偉明 3003
5 5 龐愛蘭 2351
14 14 黃成智 1731
20 3 柯耀林 1048
18 18 方國珊 1014
12 12 范國威 947
4 4 梁安琪 0
8 8 邱榮光 0
11 11 蔡耀昌 0
16 16 何民傑 0
17 17 龐一鳴 0
19 19 陳國強 0

Methods

模擬參數計算

我只利用 NOW 和 HKUPOP 合作的民調數據。我用上的是 8-8-2012 至 5-9-2012 的數據。每個候選名單都會計算綜合多次滾動民調的加權平均支持度及其加權標準差。由於較新近的數據可信性較高,故此加權較重。

蒙地卡羅電腦模擬

根據每個候選名單的加權平均支持度和加權標準差,都代表一個常態的概率分佈,可以根據該分佈來隨機抽出可能的得票率。以電腦進行 5000 次模擬選舉,再計算出這 5000 次模擬選舉每個候選名單所獲得的議席數,再據此計算勝算。假設甲名單在 5000 次模擬選舉有 1000 次可以獲得一席, 500 次可以獲得兩席。那麼,甲名單排第一位候選人的勝算是 (1000+500) / 5000 = 30% ,排第二位候選人的勝算是 500 / 5000 = 10% 。這個蒙地卡羅模擬除以亂數產生器解決支持度難以掌握的問題,更可以將名單人數、議席數等等的因素都計算在內。

Update 6-Sep-2012 : Now TV 九月六日的滾動民調不提供確實數字。可能要改用 Cable 數據。