兩公司提供的商品價格有極高的相關性等於有合謀操控價格?

tyler

圖: Tyler Vigen

數據愈來愈多,很多人都認為處理數據的技能重要。沒有新聞不需要數據,只是多還是少。人人都談數據新聞 (data journalism) ,數據新聞都是新聞, The Element of Journalism 一書說新聞的第一要務是講出事實的真相 (‘Journalism’s first obligation is to the truth’),意見是很廉價的。要從數據中找事實 (fact) ,例如找出兩條時間序列之間有極高相關性,這只是找出事實。但單單是講出事實,不代表就是事實的真相 (truth, truth is a perception that matches reality) 。如何解讀數據中反映的事實真相,這是科學的範疇。故此,數據新聞記者,除了要有記者所應有對追尋真相的堅持,還要具有一定的科學頭腦,最少要知道數據分析的限制。隨便解讀數據,到頭來就不是講事實的真相,也即是根本不是新聞。

數據新聞應該怎樣去做,我也經過不少折騰。我不太會用數據說故事,曾經寫過 TVB 藝員網絡分析,惹來不少批評。直至今天,仍在為小小稿費折騰,摸著石頭過河,煞是痛苦。故此,以下只是我的少少愚見。我其實建議記者可以就個別議題可找真的專家提供意見,香港其實不缺乏數據新聞的學者和業界人士,而我並不是其中一位。分析商業價格關係,是計量經濟學家 (econometrician) 的知識範疇,他們不僅有分析的能力,更有經濟學的領域知識 (domain knowledge) 。而我,至今也不知我的領域知識有甚麼。曾經寫過物理學,寫讀者不中聽的聲音,也引來批評,指 A Level 物理「揸槍」(不合格)何德何能寫物理學。但最少我坦率承認我物理學考試真的是揸過槍,而不是自稱是甚麼專家。

我有份教新聞系學生統計學,在解釋何謂 Correlation doesn’t imply causation (相關不蘊含因果),會從 tylervigen.com 網站找非常高相關性的時間序列作例子,隨手拿來的例子是美國政府用於科投研究的投資和美國以窒息方法自殺死亡人數的相關性,皮爾森相關系數高達 0.9978 。但是否代表科研會「引致」窒息自殺呢?

最近《香港01》發表了油公司價格相關性的偵查報道,指出油公司的油價相關性極高,故此結論是「合謀嫌疑很大」。當然,這一句話很有可能是他們找出事實後,再去訪問「專家」,是他們發表的意見。但上文已說了,新聞就是追尋事實的真相,而不僅僅是引述意見。

縱使油公司可能有合謀,但指出油公司油價相關性極高並非充份的證據。合謀與否,是一個因果關係的斷言 (causal inference),代表各家油公司因為有合謀定價,所以油價走勢才會如此一致。流行病學家 Austin Bradford Hill 指出,要由兩者具相關性,證明兩者有因果關係,最少要達成九項準則,後世稱為 Bradford Hill’s Criteria 。當然,兩者相關性甚高是其中一個準則,但還有其餘八項。其中一項是事件的先後次序( temporal precedence ),例如我見到吸煙和肺癌有相關性,想要證明吸煙引致肺癌,最少我要證明吸煙一定要先於肺癌,而不是病人有肺癌才去吸煙。如果要由油價的相關性去證明油公司有合謀,最少都要有油公司合謀的證據為先,例如員工爆大鑊泄漏油公司之間合謀的電話錄音、內部泄漏的油公司之間的合約,都是先後次序的證據。

另一個準則,叫專性( specificity ),簡而言之,是兩者有高度相關性沒有其他可能的解釋。兩公司提供的商品價格有極高的相關性( correlation )是否就等於有合謀操控價格?有沒有其他可能的解釋?更合理的解釋不是市場競爭大?假設惠康設立可樂價格的策略是百佳價減一毫子,每天派人格價,惠康同百佳賣可樂價格的皮爾森相關系數會高至 1 ,但不代表百佳同惠康有合謀。合謀的意思是兩者有協商後定價,但在上例是沒有的。

其實分析時間序列統計學上有很多限制,很容易就可以找到極高的相關性,原因之一是每個數據點之間的關係並非獨立,今天的數據是和昨天有關,是違反了一般線性回歸分析的 L.I.N.E. 假設的 I(ndependence of errors) 假設。但由於太過專門,也不便於本文列出了。

《香港01》挖掘事實誠然值得尊敬,但事實和真相的之間的距離,僅一步之遙,錯誤的引導,就只變成更大的疑點。未有充份證據就檢舉,不單止是誤導讀者,疑點利益更是歸於被告,放生了可能真的有作惡的油公司。

德文幼稚園之學德文兩個月

第二個月發現學 Grammar 好難。原因是本身就不太熟英文 Grammar 的術語。

我發現在學英文 Grammar 時,老師是從來沒有講過 Word Order (Wortstellung) 的問題。這變成了學德文時的一大問題。

德文的 Word Order 跟英文有很大不同。但如果要 generalise ,也是可以的。但要搞清,先要認識動詞的術語,這一點也是學英文 Grammar 時沒教的。動詞可以變位 (Conjugated) ,代表動詞可以根據主語人數、時態等等變化。例如 I am a man 、 He is a man 、 we are men 、 She was a man (丹麥女孩) 。 be 可以變成 am, is, are, was 之類。

德文簡單陳述句主要是跟據: 主語 + 動詞 + 其他的結構,例如

  • Ich liebe Dich ,我愛你
  • Ich habe einen Hund ,我有隻狗

這些都簡單和是很明顯的。但世界不是如此簡單,在普通 Independent Clauses (獨立子句) ,英文有時可以變成這樣: I have to learn German (我要學德文)。如果將這句直接轉成德文,會是 Ich muss lernen Deutsch ,但這是錯誤的。

因為 muss 才是這句話的變位動詞,而不是 lerne 。如此情況,變位動詞一定放在第二位置,另一動詞 (infinitive) 會放到句子最尾。故此正確的句子應是:

  • Ich muss Deutsch lernen.

問題是德文獨立子句的變位動詞是「一定」放在第二位置的。我強調,是一定。例如我想說 Then we love her. 此句三個原素分別是 Then / we / love / her 。變位動詞 love 在英語是可以在第三位置,如果直譯德文會變成 Dann wir lieben sie. 雖然一般德國人會容錯,但這在德國文法上是錯誤的。正宗的德文會一定將 lieben 放在第二位變成:

  • Dann lieben wir sie.

因為要強調 Dann ,主語 wir (我們) 變成了第三位置。

而且要記得是第二位置,不代表是第二個字。例如你想表達 The old man want to buy a dog. 直譯是 Der alte Mann will zu kaufen einen hund ,但這是錯誤的。正確的句子是

  • Der alte Mann will einen Hund zu kaufen.

Der alte Mann (那老人) 放在第一位,而不只是 Der 。變位動詞 will 放在第二位, einen Hund (一隻狗) 放在第三位。 zu 是介詞,有如 to ,在 will 之後一定要加。 Infinitive 名詞 kaufen (買) 放在最尾。

這個一定要將變位動詞放第二位置的規律,在否定句時會更見麻煩。例如 I don’t love her ,德文是 Ich liebe sie nicht. 同理要將變位動詞 liebe 放在第二位置,再將 nicht (即 not )放在尾位。

淨是消化這一點已要用一個月。頭都痛。要研究此 word order 問題,可以研究這個網頁

德文幼稚園之學德文一個月

我學母語一個月之後,我覺得我只會學到講爸爸媽媽。我第二種學的是英文,在幼稚園學,一個月之後應該學識幾個生字。

一直覺得自己沒有語言天份,之前曾經試過自學日文,失敗,也許是因為我當時只為打機,而事實上不會日語打機都不成問題。現在我三十幾歲人才學第三種語言,就是德文,學了一個月。我覺得我是處於幼稚園的水平。

現在學外語,是有目的。上文提到我從小嚮往德國,但我三十幾年來都沒有想過去學德文,也許是被學日文失敗的經驗打沉,另一個可能是從小都很少接觸德文,相反日本卻可見於電視、雜誌、遊戲、音樂。香港流行文化裡面,根本不會見到德文。

去年去過德國,買了些德文原文歷史書。正如我學中國歷史多是看中文史書,我想從德文文獻理解德國歷史。事實上我至今日都未見到有民主德國(東德)的好英文歷史專書,但走過火車站書店見到一本不太厚的 DDR 專書,毫不考慮就買了。這個沒有深思熟慮的決定,竟然成為我想要學德文的原因。

那本 DDR 專書是買了回來,但只能夠看圖。那本書的圖很精彩,但可惜的是我完全讀不到文字。以前買日文書,看得會漢字和片假名會欺騙自己看得到,但德文真是完全不能估文字在說甚麼。部份語句和名詞似英文,但其實怎讀都不明。這種不足的感覺,激發我下定決心要去學德文,去讀懂這本書。

但決心有了,怎去執行卻是關鍵。

開頭是走歪路,仍是相信一般人的學習方式,個人又窮X,走了去報公賊會德文班,但我上了一堂就頂不順。我覺得如果我繼續去上那個堂我肯定無法學會。原因有二

  1. 那個教學的人本身德語不純正。我聽過德國人講德語,亦會看 IPA ,他們用的教材部份有 IPA ,我已知道他讀得非常糟榚。再開了他們的教材 CD 來聽,就知道出事在何處。教材是來自國內,會有 Native Speaker 和國內 Speaker 的讀音,教學人士的就是國內的口音,非常奇怪。就連德文字母的讀音都非常怪,由於他無法掌握 /e:/ 的讀法,全部當成了 /eɪ/ 來讀,故此 B 、C 、 D 、 E 、G ,全部讀錯。例如 B 會讀成「悲」、 G 讀成「基」。事實上不是這樣的,原音發聲口型是沒有轉變過的。

  2. 我覺得堂上氣氛不好,上堂時間浪費在吹噓教學人士留德經驗之類。

最後我毅然決定自學。自學都要有 tools ,誤打誤撞,發現 Mondly 這個東西不錯,試用之後即時科水。現在每天都有玩這個 App ,增進聆聽、生字。

德文又以繁複的文法見稱,玩 App 學語文的問題是沒有系統,就像遊客讀 Phrase Book 學語文。我想要的是學習整個德文系統,故此,仍要讀書學習德語文法。當然,學語文是最重要是要沉淫於語言環境。我身在香港,唯有靠看 YouTube 。我發現 Easy German 這個 Channel 不錯,因為有字幕。

由於我仍是處於幼稚園階段,你問我是不是學識很多德文,識很多文法,就當然不是。我還有很多東西未有搞清楚,要再細心研究。

造句方面,只會簡單的陳述句,例如我你他是乜乜乜。例如

  1. Der Hund ist groß. 隻狗好大隻。
  2. Sie hat einen großen Hund. 她有一隻大狗

簡單問句

  1. Haben Sie einen Hund? 你有無養狗? [敬語]
  2. Habst du Freunde? 你有無朋友? [非敬語]

簡單祈使句

  1. Ich möchte einen Tee mit Zitrone. 我想要一杯檸檬茶

就係咁多。其實還有學一些時式,但未完全搞得懂。還有要學 word order 。例如

  1. Ich konnte den Weg nicht finden, weil ich keinen Stadtplan hatte. 我/能夠/條/路/唔/搵到,因為/我/唔/地圖/擁有。

德文出名難的雌雄性、不同的格 (case) 、猶如永遠是不定名動詞的眾數、時式變化,仍未完全搞得懂。另外,德語發音的 R 仍是不能完全發出。我想這些都是德文初學者常見的阻礙,有恆心是可以突破的。

在學第三語言時,增進了第二語言的認識。學習德文時我細心的研究格,我好像對英文有不同的理解。其實我在學程式語言都有類似的經驗,學了 Lisp 之後寫 R 和 Python 也好像易理解了一些,尤其是 Functional Programming 部份。

再過一個月之後再報告學習進度啦, Tschüss!

德國二線城市曼海姆給時常要爭世界第一的香港之啟示

工務關係,於德國曼海姆 (Mannheim) 工幹。
不暪你說,這是小弟三十幾歲人第一次遠行,因為是工幹關係機票及部份酒店有大學贊助,我此等窮鬼方能成行。第一個出遊的地方是自小已響往的德國,我覺得很幸運。而更幸運的是,我去的不算是熱門德國旅遊城市。我本來是有想過在曼海姆工幹後轉到法蘭克福或海德堡旅遊,但最後卻選擇只留在曼海姆。曼海姆這個城市,我自己本來都不太認識,是因為工幹才進行研究。此城港人最熟悉的德甲沒有球隊參賽1 ,難怪不少自稱德國通都未必認識此城。
以人口排名,曼海姆是德國排名第 19 的城市,比起大家腦裡的德國大城市如柏林、漢堡、慕尼克、科隆和法蘭克福,曼海姆無疑是德國二線城市2 。在曼海姆所在的巴登-符騰堡州 (Baden-Württemberg) ,其他城市如斯圖加特(Stuttgart)和海德堡(Heidelberg) 也比其有名。但這個二線城市有深厚的歷史,當中以該城市發明而知名,最知名的例子要數 1817 年 Karl Drais 在此城發明單車以及 1886 年 Karl Benz 在此城發明有內燃機的汽車。直至今天,福布斯雜誌仍將曼海姆視為全球最具創造力的城市之一
但二線城市都有其特色,曼海姆沒有高樓大廈,我見過最高的建築物都不過二十層樓。市中心地段因為歷史原因是以格仔方式規劃,亦因此此城有別名為「方格之城」 (Quadratestadt) 。此城人口只有三十萬,只比香港天水圍多一點,但此城的社群感覺濃厚,人的眼裡沒有香港式的戾氣,生活節奏沒有香港的快,市民大多過著閒適的生活。
一個人遊覽此城給我極大的文化衝擊。第一點就是人民的生活風氣。走到城市的每一端,都會見到有人拿著書在讀。城中的大書店 Thalia 單是市中心就有兩家,還有無數的小書店和二手書店。3 單單是一個曼海姆火車總站 ( MA Hauptbahnhof )就有三家書店。4 香港市容一部份的巴士、地鐵幾乎人人篤手機的情況在曼海姆不甚常見。我在想,為何德國至今仍然強大,坐擁歐洲一哥地位,是不是因為市民仍然渴求知識呢?
漫走曼海姆,你會發現此城肯定不是一個像香港那樣積極發展旅遊業的城市。城市標語、路牌的都是德文,沒有見到太多英語。5 我遊訪了市內兩處較像旅遊景點的科技博物館 (Technoseum) 和湖公園 (Luisenpark) ,仍是全德文。交通工具只有高速火車 DB ICE 有英語報站,而電車只會在曼海姆火車總站報站 MA Hauptbahnhof 後報上英語 Mannheim central station ,其他站一律以德語報站。商店店員會跟樣子明顯是遊客的我講德語,我也盡量聽。只有在完全聽不明的情況下才表示聽不會德語,他們才會講英語。德國人以其德語文化為傲,他們明確地知道公共交通、博物館甚至商店的主要服務對象是說德國語的德國人。這與香港離地的作風不同,例如中產家長教小孩廣東話沒希望只與子女講英語、商店店員6 要奉迎地講普通話、地鐵報站要用三種語言。到底我們可否做到德國人的地步,對自己所用的母語廣東話帶有自豪感,不要對外來的語言如此卑恭屈膝?
對我來說最大的文化衝擊,是在星期日走上街道。
雖然公共交通仍然運轉,但九成以上的商店都關門,當中包括跨國公司如 H&M 。絕大部份食肆也關門,只有如麥當勞之類的美式快餐店仍然營業。超市、書店、便利店在星期日一律關門不做生意。
但星期日街上仍然有人在行,朋友在街上、公園談天說笑。有人在街道跑步。上述的博物館、湖公園充滿一家大細,家長可以與子女共聚天倫,而不是連星期日都要親子相隔。
德國是全世界工時最短的國家,每周工時平均為 35 小時,每年平均有 24 天有薪年假。7 但從其經濟發展就知,他們不是偷懶,而是有效率。工時短的好處是真的做到 Worklife balance 。下午四五時就會見到很多人跑步、踏單車、放狗散步。也因為工時短的關係,我從沒有見過曼海姆有出現過外藉家傭。8 家長可以好好管教子女,無須事事假手於人。
看在香港僱主的眼裡,香港人如果要求工時短、星期天關門甚至甚麼 Worklife balance ,就是懶,是傷害營商環境。
香港中產追求子女同樂、子女能接受高質素教學9 、交通方便等等生活質素,在德國二線城市幾乎每個打工仔都在享受著。當然,德國稅率高10 ,但因為沒有高地價政策,城市的一切動力沒有被地產商所扼殺,商店不會因為租貴而全年 365 天都要營業。
香港事事都要爭第一,例如香港幾乎每年都是美國傳統基金會全球最自由經濟體,而城市亦因為要接待旅客(和只留在香港數小時的「旅客」)而令城市面貌和政治風氣嚴重扭曲。到底香港是一個甚麼樣的城市? 政府、商界在推銷政策時,聽得最多是「經濟發展」四個大字,但我從來沒有聽說過這個城市曾經追求過「生活質素」和「人民素養」。

  1. 其實此城的球隊曾是德甲前身聯賽的冠軍 []
  2. 其市的網站也自稱曼市是德國二線城市 []
  3. 大書店 Thalia 除了一個書架賣英文書之外,其他全是德文書。 []
  4. 由於市內有知名的曼海姆大學和幾家藝術學院,美術產品和文具店也相當多。 []
  5. 更不要說其他語言,如漢語 []
  6. 甚至大學職員 []
  7. 香港平均工時是每周 50 小時,每年平均有薪年價是 17 天,在全球排倒數第 7 位 []
  8. 事實上德國等等先進歐洲國家沒有外藉家傭的需求,故此從來沒有就此立法 []
  9. 德國教育幾乎是免費的 []
  10. 薪俸稅可高達 45% ,另加消費稅 19% []

論雨傘革命之失敗

之前曾有篇文談過天天都是九二九,這一篇也是承接上一篇的命題。
九二八快將一周年,報章當然就要找來佔中三子學聯學民仔來訪問。到底那場運動他們是否主角,公眾自有其論述,網上鬧爆言論有之。革命之失敗,我不會將責任只加諸於那些在鎂光燈下的人。
不要再欺騙自己,從雨傘革命找一點半點來承認成功。從任何角度而言,雨傘革命是失敗的。
你可以說,雨傘革命只是一場戰事,不是一場戰爭。盟軍也不知輸了幾多場戰事,最終在二次大戰勝利的是盟軍。所以 2014 年輸了是不要緊的,終於會勝利的。
其實我也很想這樣想的,沒錯爭取民主不爭朝夕,放眼千秋。一次社會行動失敗,可以有千千萬萬場運動繼續爭取。
但我實在沒有看到任何後續行動。擁有公權力和傳媒話語權的飯民議員曾口口聲聲說否決政改後重啟政改,何俊仁甚至說過否決政改後會辭職公投,爭取重啟政改。請問他們有沒有繼續大力爭取? 還是他們學足了梁振英的「講了當做了」? 為何他們也跟住梁振英的主旋律,將民主和民生分拆出來?
如果說香港人的核心價值,善忘保證是一項。不要說太遠的了,請問今天還有幾多人會說撐 Uber? 所以警察捉幾架 Uber 是很成功的,只要不停的談甚麼法律犯法,港人就會冷下來。
2014 年 12 月 10 日,我太悲傷沒有到金鐘,據說金鐘滿是 We will be back ,還有人唱歌跳舞巡遊。蘋果日報說人退心不退。我想問, we will be back ,是幾時 back ?
back 不一定說是再去佔領。如果再佔領,政府的打壓會更加兇,肯定亦不會再放催淚彈,而會用殺傷力更大但畫面好看的胡椒水。我也不知道怎樣可以令香港有普選,但如果連爭取的意識都已經淪落,甚至忘記了當天爭取的熱情,那就是這場運動最失敗的地方。
有美國的朋友說雨傘革命會像五四運動,在人的心種下種子。其實我很想反駁,當年五四的甚麼德先生賽先生,在中國人的心已種下了一百年,今天都沒有長出過苗,五四精神亦已變質成「尊重和包容」。如果大家經歷過一場雨傘革命,仍是正常上班下班、仍是計較誰人誰人的勝算含淚投票,對不起,這場運動已經正式被遺忘,只變成一面大家都在膜拜的神主牌,或者變成港版六四慘劇那樣可被任何人消費的一樁事件而已(包括我)。