佔領時代的facebook專頁版塊一文的 FAQ

在明報登了一篇文「佔領時代的facebook專頁版塊」,一如所料引起網上極大迴響。
這篇文的內容是我的博士研究最表皮的一層,由於這種數據公眾是想知的,而學術期刊又很少會刊登這樣描述性的研究,於是決定在報紙刊登。日後分析性的部份就只會在學術期刊刊登。

網上就這篇文的疑問,我決定以 faq 方式一一解答。

問:為何研究 facebook 分享網絡?

有人在網上說分享網沒意義。事實上分享網只是這個研究最表面而且公眾可以理解的部份,我有用其他更加怪異的方式建立網絡,詳情暫不公開了。
分享網極有意義可追溯到 Castell 的網絡社會理論,他認為網絡聯繫在一起的社會,每個個體的權力有不同方式量度。他認為在網絡裡其中一種建立權力的方法,是個體在網絡裡與其他個體分享同一興趣,因此再與其他個體建立更緊密的關係。故此,研究分享網有助我們認清哪個專頁具有較高權力。
此外,網上迷因(meme)也是透過分享網散播,現代的民意研究也發現,民意也是以分享觀點而建立。這是本研究的社會科學肌理,也是我們最先研究分享網的原因。

問:何謂中介度?與資訊提供者有何分別?

首先要講講研究的網絡是怎樣建成。假設有以下事實:

陳電鋸轉發了譚劍四次
陳電鋸轉發了陳浩基五次
陳電鋸轉發了喬靖夫六次
陳浩基轉發了譚劍兩次
陳浩基轉發了喬靖夫三次
譚劍轉發了喬靖夫二次
譚劍轉發了陳浩基二次
譚劍轉發了陳電鋸一次
喬靖夫轉發了譚劍二次

如果將以上事實轉成 adjacency matrix 就是這個樣子:

Screen Shot 2014-12-28 at 10.41.06 pm

轉換成網絡圖就會是這樣:

Screen Shot 2014-12-28 at 10.42.01 pm

圖中圓圈代表一個 Page ,箭咀代表資產流動方向。箭上的數字是引用次數。

先講講何謂資訊提供者,其實就是總引用次數。根據上表,可以計出:

陳電鋸被引用 1 次
陳浩基被引用 7 次
譚劍被引用 8 次
喬靖夫被引用 11 次

故此,喬靖夫是網絡內最強的資訊提供者。
順帶一提,另有一個計法叫 outdegree centrality ,都可量化資訊提供程度,就是每個圈箭咀射出次數。

陳電鋸射出 1 次
陳浩基射出 2 次
譚劍射出 3 次
喬靖夫射出 3 次

以 outdegree centrality 計算,喬靖夫也是網絡內最強的資訊提供者,譚劍也是三次。
好了,係時候說說甚麼是中介度。某個圈的中介度是指資訊流動時,步經該圈的次數。
我們可以找出由一個圈去另一個圈的所有 shortest path (geodesic) 。

譚劍去喬靖夫: 直達
譚劍去陳浩基: 直達
譚劍去陳電鋸: 直達
喬靖夫去譚劍: 直達
喬靖夫去陳浩基: 直達
喬靖夫去陳電鋸: 直達
陳浩基去譚劍: 直達
陳浩基去喬靖夫: 無法直達,陳浩基 -> 譚劍 -> 喬靖夫
陳浩基去陳電鋸: 直達
陳電鋸去譚劍: 直達
陳電鋸去喬靖夫: 無法直達,陳電鋸 -> 譚劍 -> 喬靖夫
陳電鋸去陳浩基: 無法直達,陳電鋸 -> 譚劍 -> 陳浩基

從以上的所有 shortest path 所見,步經譚劍次數最多,由此可見譚劍的中介度最高。
真實的 betweenness centrality 是比這個算法複雜一些,但精神就是這樣。
總而言之,如果某一個 Page 常被引用,也有不時引用別人,就較有機會有高中介度。正如我在文中所言,如果網絡內的 Page 常常經過你的 Page 與其他 Page 造成互動,中介度就會高。
由於資訊會常常流經中介度高的 Page ,故此這類 Page 就有如網絡內的中轉站。他們選擇轉發何類資訊,是有潛力影響整個網絡內的資訊流動。

問:為何 XYZ Page (Insert your page here) 不是本土派?

要講講 Page 到底是怎樣歸類派系的。
文中的派系其實是 Hidden Community ,是根據引用關係以電腦算法計算出來,是並沒有考慮該 Page 裡引用及發表的內容是否本土派論調。
因此,如果 XYZ Page 常常引用及被引用其他本土派 Page 的內容, XYZ Page 就會是本土派。但若然 XYZ Page 常常引用蘋果日報、學民思潮、謎米等等主流派,但以本土派論調大力批評之,而 XYZ Page 又會被主流派引用來作回應。在這個情況之下,雖然 XYZ Page 論調本土,但程式會將它歸類為主流派。我重申一次,那個分類純粹根據引用關係計算出來,與內容論調無關。

問:為何 XYZ Page (Insert your page here) 沒有入圍?

沒有入圍有兩個意思。第一個意思是網絡圖不見 XYZ Page 。那是因為該圖只展示最高 5% 中介度的 Page ,如果 XYZ Page 有被納入研究但中介度不高,那就不會出現在圖中。
另一個意思是沒有被分析,這一方面只有我才知道。這是因為 XYZ Page 從來沒有引用別人,也沒有人引用過你,那麼 XYZ Page 就不會被納入研究。

大數迷思參考文獻

今天《明報》 Sunday Workshop 有本人寫的文章大數迷思。以下是該文的參考文獻。

  1. 蘇鑰機, 陳素娟. 如何統計七一大遊行人數. 傳媒透視. 2003
  2. Dehaene S, et al. Log or linear? Distinct intuitions of the number scale in Western and Amazonian indigene cultures. Science. 2008;320:1217-20.
  3. 葉兆輝、傅景華. 誰在報大?真相如何? 明報. 2009-06-17
  4. Yip PSF, et al. Estimation of the number of people in a demonstration. Aust NZ J Stat. 2010; 52: 17–26.
  5. 葉兆輝. 「眾人參與」人幾多?—估算公共事件參與人數. 傳媒透視. 2011
  6. 戴捷輝, 鍾庭耀. 七一遊行的科學精神. 傳媒透視. 2012

先有結論,再如釣魚般抓取證據 的「自縊」《調查報告》

李旺陽再次成為傳媒焦點,可見李旺陽慘案根本沒有解決過。劉夢熊現在才說李旺陽案的報告有疑點,可能做假,我想講我寫的這篇文是在 7 月 15 日刊登,距今已快兩個月。


《關於「李旺陽死亡」的聯合調查報告》最大的疑點有三,我認為並不能完全排除他殺之可能。

我曾在拙作寫過,一宗案件要問的問題亦有三,就是howdunit(怎樣做),whodunit(誰人做)和whydunit(為何做)。李旺陽案的三個疑點,都是由此三問題引伸出來。

1. howdunit 李旺陽的最後生存時間有人知道嗎?

驗屍指死亡時間是「為6月6日凌晨1至3時」。但是值班護士庾香艷在6月6日2時58分看到李旺陽在窗邊時向與李旺陽同房的李樂生說「李旺陽在做運動,沒關係」。為什麼護士要如此說?根據驗屍死亡時間,李旺陽在2時58分已經上吊,上吊和做運動的分別我想護士是可以分別出來的。

報告提及目擊李旺陽最後生存時間是6月5日22時,目擊者是鄰牀病人,在睡前見李坐在牀上。之後已經是2時55分,此病人睡醒見李旺陽在窗邊。

6月5日22時至6月6日2時55分,其間有4小時55分「空窗期」。為何沒有醫護人員在此段期間李旺陽狀態的口供?難道值班醫生、護士都在食消夜不巡房?

而根據閉路電視紀錄,於6月5日22時至6月6日6時28分,進出李旺陽所在7樓病房區域的人員共7人,包括一名醫生、一名護士、同房李樂生和4名陪護,為何不查證6月5日22時至6月6日2時55分此段空窗期出入病房區域的此7人,有否進出李旺陽房間?如有,此7人的證言非常重要,他們如不是殺人疑兇,也可提供線索證明李旺陽最後生存時間,進一步縮短空窗期,縮窄搜查範圍。可惜,報告方面毫無交待。

假設此為他殺,閉路電視證據反而證明此為密室殺人,最有嫌疑的兇手是此7人。

2. whodunit 縊死就等於自縊嗎?

醫療專家組驗屍指出李旺陽屍體表面及內臟器官沒有損傷,口鼻腔皮膚、粘膜沒有出血及破損,毒物檢測未見異常,但頸部損傷符合縊死條件,故死因僅為「生前縊死」。如果我接受一個人可以如專家組所言﹕「頸部受到15公斤壓力就足以壓閉呼吸道,受到17公斤壓力就足以閉塞所有血管,使腦部血液循環完全停止」(有關此說法是否有理,要由專家去分析,可參考七月十三日《明報》——港法醫教授﹕自殺結論不合邏輯),但如此證言仍然只能證明李旺陽之死因為縊死,而非自縊。可是報告書卻出現邏輯跳躍,指出李旺陽死因為「自縊」。

根據報告,李旺陽「自縊」的佐證是「失明狀態能獨自完成全部縊頸動作」以及屍體發現現場的牀、窗邊留有李旺陽指紋、DNA和腳印。但是,這些都並不能證明李旺陽「自縊」,只可證明李旺陽死前有到過現場。由此,報告給我一個強烈感覺,就是似乎是先有「李旺陽自縊」的結論,才有如釣魚(fishing expedition)般抓取「自縊」的所謂證據。亦因此,鑑證方面出現嚴重的偏向性。就連可證為他殺縊死的重要證據﹕李旺陽頸上布條和上吊位置有否李旺陽以外的指紋和DNA,報告中也沒有交待有否調查。

我可以提出另一個假設,而且可以完全合乎報告上「自縊」的證據﹕醫護人員趁李旺陽睡覺,注射或點滴麻醉藥(合乎「毒物檢測未見異常」),再撕李旺陽牀單製成布條,布條纏住李旺陽頸項,再將他掛於窗邊(合乎現場有李旺陽DNA)。失明狀態能獨自完成全部縊頸動作,沒有失明的醫護人員也能為李旺陽完成全部縊頸動作。由於李旺陽被麻醉,故此醫護人員將李旺陽掛於窗邊,一放手,李旺陽雙腿沒有力量,就算雙腳着地也無法出力抗衡體重下墜的衝力,故此「受到17公斤壓力就足以閉塞所有血管,使腦部血液循環完全停止」。

由於醫護人員殺人,故此護士在事發後2:58分向李旺陽同房的目擊者李樂生訛稱「李旺陽在做運動」以作掩飾對她有利。

報告無法排除以上他殺假設的可能性。

3. whydunit 自殺真是毫無徵兆嗎?

任何有研究過自殺現象的人,都會告訴你自殺行為並非毫無徵兆。幾乎所有的自殺都不是臨時起意的事件,而是一件計劃周詳的事。醫學上有所謂自殺念頭(Suicidal ideation)的概念。根據芬蘭的一項研究,四分之一自殺身亡的人,曾有在死前會見醫生時說過自己想過尋死。兩成至五成自殺成功的人,都曾有自殺前科。就算香港防止自殺的電視廣告,也要我們要注意親戚朋友有沒有情緒困擾、送出心愛的東西、對關注的東西失去興趣等等自殺徵兆。

假設李旺陽有情緒心理問題,我會更加相信李為自殺身亡,因為情緒困擾和抑鬱都是自殺的最高危因素,其他的自殺高危因素如長期病患、曾受迫害等等,也只是情緒困擾和抑鬱的遠因。李旺陽當時是入院接受醫生診療,而檢視病人精神狀况可說是醫護人員的常規工作,但報告中完全沒有李旺陽生前的精神和心理狀况描述,反而沒有太大關係的其他健康狀况如甲狀腺功能亢進症、高血糖卻大書特書,是否懼怕寫下「李旺陽生前精神狀態正常」會惹人猜想?李旺陽家人也應該理解他的心理狀况,為何整個調查報告都完全沒有接納他們的證言?

反之,證明李旺陽沒有自殺動機的證據也是有的。例如在5月22日的有線電視訪問,一個會說出「就算砍頭也不回頭」,意志力如此頑強的人,完全不像會自殺的人。

後記

有法醫認為報告科學全面,而證明李旺陽自殺的另一個重要原因,是他身體表面和內臟器官都看不到有機械式損傷,足以排除他殺的可能性。此醫生中了圈套,是我所指的第二問題,證明縊死不等於自縊。醫生的argument邏輯上叫訴諸無知,但是absence of proof is not proof of absence(沒有證據證明他殺,不等於證明了沒有他殺)。

此外,表面內臟器沒有機械性損傷,也不自然等於自殺。原因有二﹕

1. 損傷除了機械性損傷(如撞傷、刺傷)之外,也有可能是化學損傷(如服毒)或生物學損傷。(如注入其他相冲血型血液引致急性血中毒)如果有落毒的話,內臟是沒有機械損傷,但那仍是他殺;

2. 內臟器檢查通常只指心肝脾肺腎檢查,並不包括神經系統和血液系統檢查。假如李旺陽是被搖晃至腦溢血死亡,內臟故然是沒有機械性損傷,因為那要用CT掃描或核磁共振才能檢測。但那仍然是他殺。

不過我不怪他,他是醫生,不一定有偵探頭腦。我見過不少也是死頭死腦的。

原文刊於 2012 年 7 月 15 日明報星期日生活版。

【舊文】了解清楚 恐慌不遲

三一一大地震一周年,特別刊登這篇舊文。此文在討論區被網民大力修理。一年過後,未知世人又有何種體驗?

———

在廣大讀者面前承認考試不及格需要勇氣。對,我當年高考物理學不及格,只僥倖入讀大學。面對當前福島核電危機,我想測驗一下自己對核子科學的理解。我從腦海中找回當年F等的物理學知識,茲列出如下﹕

新聞天天重覆的字眼「輻射」,是指移動的能量,光線、電磁波甚至聲音都是輻射。形容現今情況更精準的字眼,應該是核輻射。核輻射又分幾種,分別是Alpha、Beta、Gamma射線及高能量中子,他們是放射性同位素發生核分裂時放射出來。為何核輻射有害,是因為它們能夠令原子及分子中的電子脫離,破壞原子及分子的結構,例如DNA的結構。基因突變,啟動癌症基因,引致細胞病變,亦即是癌症。

從以上認知小測驗可知,我與一般市民對核輻射的認識相若,不敢說自己比別人更認識核輻射,於是乎找來文章研讀惡補。讀過的文章,以英國廣播公司找來牛津大學醫療物理學系教授Wade Allison撰文分析人們面對核輻射的態度的一篇印象最深。他指出日本當前被海嘯蹂躪,過萬人失去寶貴性命,存活下來的災民面對飢餓及寒冷威脅;但傳媒卻將焦點放在至今沒有傷害人命,而且在未來都極有可能無人會被直接殺害的核輻射身上。

非理性反應

對Allison的觀點有興趣,於是找他的著作 Radiation and Reason 來讀。此書主要討論人們面對核輻射的非理性反應。他令我想起同樣來自牛津大學、呼籲人們理性面對宗教的Richard Dawkins。與Dawkins命運一樣,Allison自動成為了爭議人物。他的立場燒著反核團體,對著科學界同仁他同樣兇狠,他大力批評美國科學界制定核輻射安全標準所使用的「線性無低限模型」,指其完全沒有科學根據。
Radiation and Reason 主要探討兩個問題,第一個問題是現行的核輻射攝收標準是否過低;第二個問題是為何人們會懼怕核輻射。
就第一問題,他認為現時的所有核輻射標準都嚴重偏低,而且設定標準的政治考慮多於參照科學證據。例如一般市民從環境攝收的核輻射上限制定為每年1毫希,但事實上歐美國家正常人每年都會暴露於2至3毫希的核輻射。所以那個攝收上限,正常人都會像香港報紙的寫法,是會「超標兩三倍」的。照一次電腦掃描,更加是會「超標十倍」。由此可見新聞大字標題的「超標N倍」,如不細心分析,根本毫無意義。他認為核輻射標準必須更新,且要建基於證據。他認為根據現時的科學證據,標準可設在每月一百毫希,終身不高於五千毫希。
至於第二個問題,他認為人們對核輻射的恐懼,除了冷戰時期政治宣傳因素之外,亦源於一般市民對它的不理解。在核子發電及核子武器發明初期,科學家的確是未完全理解核輻射對人類健康的影響。但是,經過日本原爆、三哩島及切爾諾貝爾事故,科學家掌握了大量人類攝收核軸射的長遠健康數據,生物學在過去幾十年也有長足的發展。現在的科學觀點認為,核輻射的致癌風險影響,遠低於之前的預料。人體有非常奇妙的保衛機制,去阻止電離輻射破壞DNA。動植物界比人類利害。在切爾諾貝爾災難封鎖區,今天的核輻射量仍達每小時六毫希(對比超標不知幾多倍的福島二十公里封鎖區的每小時0.1毫希,屬超高水平),但該地已經變成野生動植物的天堂。這是因為動植物經過幾代繁殖汰弱留強,已經適應高輻射的環境。

心理威脅遠超患癌風險

但核輻射真的完全沒有問題嗎?Allison認為核恐懼所產生的心理問題對人類健康的威脅,遠超核輻射本身致癌的傷害。世界衛生組織對切爾諾貝爾核事故的報告,認為核事故對人的心理健康影響嚴重。另一個研究也發現,切爾諾貝爾事故,令居住在附近的孕婦,自行選擇打掉胎兒,因為懼怕胎兒受核輻射影響。三哩島事故後,核電廠只泄出極微量的核輻射,但周邊居民出現創傷後遺症,而且十年未退。最近福島核事故,也有核輻射破壞生計感到悲哀而自殺的老農夫。
人們對不認識的東西,易生恐懼和疑惑。食品添加劑、疫苗等等,都是例子。當我們談到恐懼的東西,就會放大它的風險,連最基本的「劑量決定毒性」原則也忘記了。我們對事物的固有觀感,或稱偏見,就是這樣煉成的。人人都想將任何事的風險減到最低,但是風險並不會減至零。風險等於零的社會,存在於烏托邦。由於我們是住在香港而不是烏托邦,所以下次天文台驗出大氣中有放射性碘,第一個反應不應是「騰雞」,更加不是去搶鹽搶碘片,而是問問濃度有幾多,是否達到危險水平。
能源一向是由血汗和人命混和起來生產的東西。福島事故發生不久,國內有火力發電廠發生一氧化碳中毒殺了九個人,煤礦事故更是無日無之。化石能源產生溫室氣體引致氣候改變,同樣致命。核電一如其他能源,有其潛在危險和污染問題,亦有其高發電量之優點。在反思核能的同時,我們是否更應該反思我們對能源依賴,還有以能源帶動經濟,推高GDP的現代發展觀。

原文刊於 2011 年 4 月 10 日明報星期日生活版。

p.s. Radiation and Reason 比書去年由日本德間書店推出了日文版 – 放射能と理性 なぜ「100ミリシーベルト」なのか