MacGrass: 增長太快?

回想起2006年三四月,MacGrass的RSS訂閱人數通常只在100-300之間遊走。在今年二月尾,人數已經增至800多。至現在四月尾,已經暴升至12xx人。即是一年之內,除了RSS成為更加深入民眾的技術,MacGrass的讀者人數也保守估計增加了兩三倍。先要多謝大家的錯愛。
增長太快,最快出現的,是Growing pain。MacGrass已經多次被hosting公司警告,我們的網站引致他們的Server出現High loading事件,這會引致同一Server內其他的網站效能下降。也因此,MacGrass被hosting公司在同等服務價錢之下,比其他的Account同時運行的工作數由10個減至5個,以及每個PHP執行的時間不能多於兩秒。他們警告,要是超過上列限制,他們可能會暫時將MacGrass關站。
當然,這個限制暫時不會對MacGrass構成影響。但當出現如WWDC、MacWorld之類的大件事,MacGrass網站勢必多人,到時又可能會再出現High loading事件。MacGrass的文章、Comment數愈來愈多,讀者人數又出現增長,PHP、SQL運行的速度在硬件沒有更新之下只會愈行愈慢。PHP執行時間限制到兩秒,未必可能應付得來。
可惜,MacGrass是一門蝕本生意。我曾有計劃將MacGrass搬到dedicated server,但以MacGrass無收入的情況下,我覺得每月七百元的服務費用不太化算,一年就會是8400元。It’s impossible!我有這樣的錢我不如拿來還債。難道像基督教要教徒將10%月薪奉獻教會那樣,將我的10%月薪奉獻MacGrass咩?
暫時未想到解決方案,故此MacGrass只好維持於現在的「不平等對待」局面。

update: 昨晚已經出現了一次關站版面。今早Kelly安裝了Wp-Cache,看看有沒有改進。

FUD再爆:影視署辦事不力 毒歌流入本港

上網亂dup新聞。這比胡亂曲解食環署的食品安全測試報告更加不知所謂。起碼食環有經實驗室Check這食物含有害物質的份量,今次只是抄某個網的指控。這個網有Check過食物嗎?如果我話聽Beatles歌會引致性無能,你Quote我這個網報道一個新聞,結果又會怎樣?就是馬扁報要再出版多一次。

影視署辦事不力 毒歌流入本港

【馬扁報訊】香港爛廣東歌當道,市民聽歌都會選聽外國音樂。但Confide in me網卻揭破,The Beatles歌曲內含不知名的聲響元素,專家指出長期收聽會對腦袋有害,如損害神經系統引致性無能。故提醒市民勿「以歌取碟」。

輸港歌曲抽驗及格

本港影視署表示,正向英國Apple Record了解。而影視署去年抽驗本港市面售賣的唱片,除了廣東歌有99%爛之外,未有發現任何有害聲響元素。 而880個外國音樂樣本,結果全部合格。

Confide in me網近日揭破,The Beatles音樂含有有害聲害元素,會引致嚴重性無能。該網專家引述一篇由本地十間唱片公司資助的研究報告指出,六七十年代全世界興起The Beatles音樂,也因此七十年代起男性性無能的發病率出現爆炸性增長。另外,發病率在八九十年代爆炸性增加的愛滋病、癌症、禽流感、沙士、自閉症及「蒙古症」等等,相信亦是和The Beatles音樂有關。

Confide in me網專家分析,市場上仍有有害的The Beatles唱片出售,是因為消費者常常「以歌取碟」,專挑最好聽的唱片來買,所以商人投其所好。Confide in me網昨發表聲明重申,上述內容旨在提醒消費者挑選唱片時勿以歌取碟,並不代表The Beatles音樂內含有害聲響元素很普遍,而對於內地有傳媒轉載時加入「港英政府埋下的炸彈」等字眼,是曲解其本意。事實上,內地報章去年曾報道香港出現公正、沒有嘩眾取寵報紙,但其後發現只是一名兼職記者吃飯時道聽塗說而虛構的。

p.s.  今日在MG寫AppleTV時,本來想再影射教宗一次。不過做人留一線,而且佢搏眼球的文章已經達成目的,於是乎我將其改成正常MG料。

Statistical analysis of commenting behaviour in blog

以下是火星話:(看不明可以Skip)

我收集了MacGrass 75個post的comment數目,以R輸入數據
commentdata < - c(3,4,5,2,20,0,2,0,1, 0,2,0,0,6,1,6,2,2,3,0,0,0,3,0,0,3,6,1,0,2,4,3,0, 1,1,3,0,2,0,3,0,2,1,1,0,0,8,0,1,1,0,0,0,9,1,6,0, 5,18,0,0,3,2,2,5,1,2,0,1,0,5,5,7,0,3)
我試圖出一個Stem and leaf diagram
> stem(commentdata)

The decimal point is at the |

0 | 000000000000000000000000000000000000000
2 | 00000000000000000000
4 | 0000000
6 | 00000
8 | 00
10 |
12 |
14 |
16 |
18 | 0
20 | 0

>
發現0個comment的frequency最高。單睇圖,肯定不是normal distribution。平均數(以mean(commentdata)計算)是2.4。假如是normal distribution的話,最高frequency的應是2.4附近。
我以Kolmogorov-Smirnov test證明,Comment數目不是normal distribution。以R計算的方法是
> ks.test(commentdata,"pnorm",mean=mean(commentdata),
sd=sqrt(var(commentdata)))

One-sample Kolmogorov-Smirnov test

data: commentdata
D = 0.2485, p-value = 0.0001896
alternative hypothesis: two-sided

Warning message:
cannot compute correct p-values with ties in: ks.test(commentdata, "pnorm", mean = mean(commentdata), sd = sqrt(var(commentdata)))
>

由於p值低於0.05證明comment數目不是normal distribution。
單睇圖,似是Negative Binomial Distribution。我試圖去Test。
>library(vcd)
>> gf < - goodfit (commentdata, type="nbinomial", method = "MinChi") > summary(gf)

Goodness-of-fit test for nbinomial distribution

X^2 df P(> X^2)
Pearson 7.831838 9 0.5511779
Warning message:
Chi-squared approximation may be incorrect in: summary.goodfit(gf)
>

成功證明comment數字是Negative binomial distribution。

以下是火星化的地球話:

假如MacGrass comment數不是Normal Distribution,即是每篇文是沒有一個約定的可能Comment數(平均Comment數)和一個約定的spread(Comment數的SD)。
Negative Binomial Distribution,證明人客留言是一個Poisson Process(泊松過程)。泊松過程的特點是發生機會低。我其實不能將MacGrass Comment的數字fit在一個Poisson distribution。又證明客人留Comment的可能性不是一個Constant rate。而係可能有Time-dependency/episode dependency。即是人客留言,是受post出來的時間,又或本身有幾多個留言所影響。
我沒有adjust一個post推出時間之時間與comment數之關係,我假定一個post出完之後,過了一個高峰期之後無人留comment。

以下是純地球話:

嘩!原來只要有人留第一個Comment就會有好多人留Comment架啦!

MacGrass見報!

macgrassonam730.JPG
AM730中環博客。我不想像其他人見完報後還要狂指出報紙報道的錯處。Let it be!講完!

據其他博客的經驗,每見一次報,該篇文章會有十至100個留言不等。相信本文不會獲得如此多的留言,相信與該文的長度、以及博客本身的誠意及是否好雙遇有關,是一個Positive correlation。