最有價值的電視演員一文的FAQ

寫了一篇文,又要寫多篇文解釋。愈後愈甘。
先宣佈事一件事,就是該文的所有數據及分析軟件都可以在本人 Github 找到,有興趣可以自行試玩。

Q: 沒有與曾健明合作的演員叫甚麼名?
A: 黎芷珊、黃山怡、陳慧珊

Q:第二條問題是很多人都談。我想抽出最有意義的一篇回應。

以下是 Facebook Minnie Li 的留言

“感覺作者是個有實力的技術宅,但不知道為什麼方法論出了問題。不恰當的量化和類比,結果使得全文陷入循環解釋的邏輯謬誤,可惜了一盤華麗的網絡分析演示。
對「最有價值演員」的量化,照搬了行業競爭中的合作網絡分析,問題是演員之間「參演過同一部電視劇」的這種「合作」,和行業中的企業或決策人的「合作」,是同一種性質的「合作」嗎?直接把後者的特徵向量中心度套到前者身上,被量化的還是「演員價值」這個概念嗎?
很明顯作者錯把「張智霖和買餸阿嬸在同一電視劇中出現」視為和「馬雲聯手馬化騰」性質相同的「合作」。這使得作者對「最有價值演員」的定義,其實指向的卻是「最活躍龍套演員」,因為按作者對「合作」的定義,龍套演員與他人「合作」程度一定是最高的。最後很自然就導致了百大「最具價值演員」基本都是聽也沒聽過的名字;而資深龍套雲集的電視劇成了「最具價值電視劇」。我相信把這一套分析用到世界上其他地區的電視劇界,得出的都會是相似的結果,除非某地的龍套具有全然另類的從業模式。
作者很有技術地演示了如何將最活躍的茄喱非找出來,然後想用「找出來的都是茄喱非」這件事,證明「電視劇演員這行的向上流動機會少之又少」這一近乎常識的結論。雖然我覺得這結論挺符合事實,但可惜它和前面連篇累牘的論證一點關係都沒有。。。”

A: 感謝他/她的留言,我的確是一位失敗的分析員及寫作人員,甚至連甚麼技術宅都不是,因為我出名寫爛程式。
其實這種文或多或少是有「認識茄喱啡」的主旨。未分析之前,我已預料三四線演員的 Eigenvector centrality 會高,只不過是想真的量化看看結果如何,以及想知是哪幾位演員而已。
文章前面已講了,「演員價值」人言人殊,若是這樣的話是沒有可能完全客觀地量化的,這個方面我承認用詞有點不當。也許用他的 Terminology 更好,最活躍演員1 。而高 EVC 較高「價值」(成就),是以其他研究的結論得出。例如在科學合作網絡,組成方法是將論文作者結成網絡,高 Eigenvector centrality 的研究人員價值是真高2 。而科學合作網中,無論是 Chair Professor 或 Research assistant 都可成為論文作者,而結果卻不是 Research Assistant 跑出,也許是科學合作網會偏向將 Research Assistant 排除吧。
臨時演員都是演員,這是我的 inclusion criteria 。除非我有每一套劇集的劇本,可以準確的控制 (adjust) 演員和演員合作的分鐘數,否則是無法分辦在一套劇中的合作程度。我只好將全部視為一樣。當然,這就會出現上述「張智霖和買餸阿嬸在同一電視劇中出現」的問題。
其實要將「茄喱啡」排除是可以的。在維基百科的條目,是有一個 field 叫做「演出」,我想那些只是主角、配角之類,會將買餸阿嬸之類的演員排除。但此 Field 也有問題,就是不知道它的納入條件。

testgraph_famous

但無論如何,我也只用包含於「演出」的演員作分析,我相信演員與演員之間合作會較同質。最終有 456 人被分析,組成網絡後得出 Eigenvector centrality 最高的頭十位是馬國明、蔣志光、楊怡、黎耀祥、黃浩然、鍾嘉欣、胡定欣、曹永廉、陳豪和陳國邦。我想,如果我說這些是「有價值演員」(或最活躍主角、配角),會較易為大眾所接受吧。
「電視劇演員這行的向上流動機會少之又少」的結論是建基於活躍茄喱啡不知名以及活躍茄喱啡不會獲獎兩點,的確全世界的電視劇界都是這樣運作的,有時常識都要用數據證明。我的 PhD 研究也只是用數據證明「常識」有錯。

Q: Yahoo! 留言-量不重質的分析. 唔該晒, 分析”完”.

A: 係,量化分析的確是重量不重質的。唔駛唔該。

Q: Yahoo! 留言-連立論既邏輯都有根本性錯誤, 枉叫數據分析員.

A: 立論是建基於其他範疇合作網絡研究,可以討論 TVB 演員合作網絡與其他網絡不同,但不分析過又怎會知,這就是社會上最卑賤的數據分析員的作用吧。

  1. 但可惜的是最活躍沒有 Network 的概念在內 []
  2. 如 citation 及知名度會較高 []

Today on history:

  1. 2010:  雷公劈友除世害(1)
  2. 2006:  Learn by hacking(0)
  3. 2006:  男士今天你很好(0)
  4. 2005:  The death of our wiki 2.1(0)
  5. 2005:  the dead of wiki II(0)
  6. 2005:  The only valuables(0)
  7. 2004:  Firefox SMO(0)
  8. 2003:  Why Bush?(0)
  9. 2002:  Saturday Night(0)
  10. 2002:  Rich & Poor.(0)

2 thoughts on “最有價值的電視演員一文的FAQ

  1. 你好:)其實我還蠻驚訝會被原作者看到並回覆的。謝謝。
    我非常明白對絕大多數的概念來說,都不存在所謂客觀/完美的量化,所以人所能做的只能是,對核心概念及其在想驗證的假設中所牽涉的特徵/面向/機制有更清晰的理解,盡量找到可以更準確或者有效反映出這種特徵的量化方法。
    為什麼在科研合作網絡中,RA的排名贏不了Prof,而同一個指標卻在演員合作網絡中讓群眾演員排在了最前呢?因為這個EVC指標要有效關聯到價值/成就的話(假設這種價值被量化為專業等級、行業排名、創造效益等類似指標),其所牽涉的「合作」方式具有和「研究發表式合作」近似的特徵,而和「參演式合作」卻有很大的差異。這就是為何同一個指標運用在兩個不同的網絡,卻指向了截然不同的結果。
    在研究發表中,參與者間的「合作」具有自主/自發、互惠、協商等特徵,各方通過策略性的考量和協商,在合作中創造更大效益或提高效率,以增加自身價值。但在電視劇拍攝中,主角配角和群眾角色出現在同一張參演表並不是他們彼此出於策略性考慮而彼此協商、選擇的結果,各人的出演主要是被導演決定的。所以就算EVC再高,它反映的更多是出演率而不是策略性合作的程度。而群眾演員的出演率和主角的出演率事實上含義也不同,是不應輕易合併為一項的。
    沒有RA作為合作者出現,一篇科研文章仍然可以發表,但沒有群眾演員,很多場景可能根本拍不了。再加上群眾演員的參與門檻低,同期參演多個劇組的群眾演員都可以,使得其出演率極可能高於主角配角。這種特徵在RA身上是沒有的。
    所以EVC運用於演員參演式的「合作」,是很難像科研合作一樣有效關聯到價值/成就的。
    其實無論是誰,在方法論上永遠是存在改進空間的,所以方法論上的不足無法否定idea本身的價值。瀏覽了一下你的blog,你各種有趣的idea和動手驗證的行動力,給我留下了很深的印象,在此表達我真誠的敬意。

  2. 1)請問如何能計算出最有價值演員?
    2)那條算式是什麼?
    3)如何以那條算式計算出最有價值演員?
    4)計算時,是否需要運用到收視率?

Comments are closed.