Google
 

星期四, 1月 24, 2008

星座與疾病,到底有沒有關係?

這個月初,健保局公佈了星座與死亡相關的分析,我看到的第一個反應是,堂堂一個健保局,擁有這麼多資源,竟然做這種小兒科的事情,新聞上,只告訴大眾什麼星座最長壽;什麼星座最短命,沒有統計數據,一點都不科學。
類似的題目,我給學生當作業,也比這些有學問多了。最近一次的題目,是分析星座和疾病的關係,自醫學占星術出發,從住院資料中,嘗試去分析出些有趣的結果,主要的目的,是讓學生練習資料處理、以及分析工具的使用,拿星座當題目,是為了提高做作業的興趣啦!
不過,看到健保局閒閒沒事炒新聞,我也按耐不住,趁著這兩天比較沒有很忙,拿 2002年健保資料庫的門診處方及治療明細檔,大約有 2.6 億門診人次,分析四千多個 ICD9 和 12 個星座的關係,然後用 Flex 寫了一個簡單查詢介面: http://astro.ecozer.com

挑一個有興趣的星座,點進去後(這個例子是選巨蟹座),中間的 DataGrid 依照患病人次,降冪排序。最多人次的,是急性上呼吸道感染(ICD9 465.9)。

點選這筆紀錄,會顯示巨蟹座和不是巨蟹座的人,得急性上呼吸道感染的機率。

只有這樣,當然不行,我做了最簡單卡方檢定,有傳統的統計假設,2X2 的列聯表,alpha、Chi Sqaure 還有 p-value。
如果想要用疾病查星座,可以按「疾病導向」的按鈕。

依照 Chi Square 的大小,降冪排序。

最後一樣可以點選其中的資料,顯示卡方檢定的結果。

搞了半天,星座和疾病,到底有沒有關係?
即使有統計上得顯著差異,也只能當作參考,且樣本數很大,只要有一點點差異,就很容易造成統計的顯著差異,況且,我的樣本就是母群體。以上面例子來說,巨蟹座的人得急性上呼吸道感染的機率是 16.3%;而不是巨蟹座的 15.87%,兩者只差 0.43%,可是 Chi Square 卻超大,有 2590.684,究竟要不要相信統計的結果?看個人囉!
廢話了這麼多,只是想要用數字來說話;現在的官員、記者等,肚子裡有料,有擔當的不多了,就連聯合國的總部,也可以搞錯!資訊爆炸的時代,不僅要努力吸收,還是要思考過濾,不要完全相信囉!

沒有留言: