閱讀記錄《統計,改變了世界》

這本《統計,改變了世界》是我大二時候非常喜歡的一本書,也借閱了好幾次,慢慢看並弄懂該書想描述的概念。它提到了許多統計學史上意義非凡的思想誕生的過程,也讓我對於一些台灣教育上並沒有強調,甚至是忽略掉的概念有了新的思考。

曾經跟同學討論過「科學」的定義。什麼是科學?雖然這個命題聽起來很簡單,但是經過思考以後,大多數的人(包括第一次遇到這問題的我),都會訝異於竟然沒有辦法指認何謂「科學的」過程、「客觀的」方法。學了 15 年的自然科學,卻不能描述為什麼課本裏面粗淺的實驗過程就能證明各種完整、繁複的各式理論與知識結晶。

我想可以先從「可證偽性」(falsifiability)這個概念著手。記得大學普通生物學裏面講到實驗的方法的時候,並沒有講「可證偽性」這個概念,而是只簡單陳述了什麼是「科學實驗的方法」。可能是因為可證偽性頗為哲學而且形而上,所以沒辦法在短短幾十分鐘之內,用幾張投影片講完。「在科學裡面要證明一種東西是錯的往往較容易﹐但要證明是對的卻很多時候都不可能。」更細緻的來講,我們從可證偽性的概念出發設計了一系列的實驗,並且最終獲得了實驗結果,從結果到結論這一步,才是科學研究中真正困難的。我們如何能確認實驗與假說相符,或者不相符呢?

從別的角度切入,需要驗證的情況也有很多種。絕大多數情況下,我們更不可能把所有的對象加入試驗中。例如:電池公司需要了解生產出的電池實際容量,不能每個都試驗但是又需要取得足量可倚賴的數據;或者是藥物公司,他不可能讓全世界每個人都來參與藥物試驗,既不符合經濟效益,同時分析起來也有極大的困難度。

不論是前者的分析需求,或者是後者的樣本對母體的代表性,統計學就是此時最有效、強大,也是唯一的工具了。然則我們在上統計學課的時候,並不知道統計所具有如此巨大的重要性,也不知道各種方法其歷史背景與目的。這本書從科學思想剛剛萌芽的時候開始說起,看那些發展出統計學天才們並逐步帶領人們從平均數與標準差走向另外一個分析的層次:像是建立虛無假設,並採用正確的統計方法來檢測命題是否成立。而從中發展出了面對各種不同需求的統計方法,例如 z 檢定、t 檢定等。

之前我協助了弟弟科展數據分析。我注意到雖然小心翼翼控制各種可能變因,例如操作當下溫度、使用同一份器材,以及在相同的條件下(例如:器材是乾燥的)展開各種實驗,但是實驗數據的分佈依然是不能一眼看穿。正如同書中所說:

其實所有的實驗就某種意義來說都是草率的,即使是最細心的科學家來做,也得不到正確的值。有許多無法事先想到或觀測不到的小擾動,會影響實驗的結果:可能是室溫太高,或者物體在滑動之初,卡住了百萬分之一秒;可能正好旁邊有隻蝴蝶飛過,牠的翅膀造成了空氣的些微擾動。我們從實驗得到的數據是散亂的,沒有哪個數據完全精確,但所有的實驗數據都可以拿來估計真正的值。

通過閱讀,以及實際應用統計學於研究當中,我重新思考了各種情形下對於應用統計學於研究中、生活中的重要性,並希望自己能在未來繼續深入研究統計學與藥理學、公共衛生、流行病學等的各種關聯,且對社會做出貢獻。