close
在一個研究裡,常常最後就看到一堆統計數字舉證,然後就可以下結論了,但是到底統計是什麼時候牽連進來的?
很多讀者只看到最後的數字,或是以為文章裡”據統計…”的那一段裡才是統計做的事。但卻不知道,為了真正讀出最後那幾個數字的意思,有多少背景是要先學習的。
先講一個小故事,看看統計觀念在生活裡是如何運作的:
某天和一個學弟聊天,聊到他修的一門課。
學弟說:這次考試考了90分。
我不知道看到90分大家是怎麼想的,但是對我來講這是個沒有任何訊息的數字,我也不知道他一般的學習情況如何,所以我必須問:90分是如何?你覺得滿意嗎?
學弟說:還不錯,有2人考了100分,但是90分以上應該有7個人。
看起來有些訊息,他是前7名,我可以感受他愉悅的情緒,但是愉悅的情緒是因為他真的考很好了,還是他比自己預期表現的好?而單純數字給的我訊息還是很模糊的。
我必須進一步問:有幾個人參加考試?
因為我知道一個班有幾個人考試是不太一樣的:少一點可能就十個,多一點上百個都有,這時候前七名的意義就不太一樣了。
但我真正想知道的是”整體成績分布圖”,一般可能用莖葉圖或直方圖來表示,因為考卷對學生的難易度是不太一樣的,所以在看考卷前,這種圖才能給我對這次考卷難易和考試成績有一個基本的認識。
有些考試太簡單了,整體成績偏高;
有些考試太難了,整體成績偏低;
有些考試很容易出現雙峰,就是有一小群人考偏高,然後有一大群人考偏低。不同分布情況,或直接影響我對"90分有多好”這件事的判斷。在知道整個成績分布前,我對這個90分是好是壞的概念都是模糊的。
然後你就會理解,為什麼統計老師們都有個的通病:每次考試很愛畫一張全班成績的莖葉圖或是直方圖給學生看,其實就是讓學生們知道全班成績的分布。還有能看出自己這次考試表現什麼樣的情況。
因為個人的分數和名次、還有班上的平均數、中位數、標準差這些數字很多時候都不足以描述學生們目前學習情況,還不如直接把整個成績分布畫出來更清楚明白。當然,如果要細究一個學生學習情況,是看考卷的問題和他的答題情況,而不是停在分數而已。
這裡以一個簡單的成績當例子,希望能讓更多人明白:
單單幾個數字的訊息,比一般人想的少多了!!!!!
單單幾個數字的訊息,比一般人想的少多了!!!!!
能讀到真正數字訊息的人,是因為他已經有了更多相關知識。就像你知道女生身高在170cm在台灣已經很高的,是因為你知道台灣女生並不特別高。但對一個沒有這種知識的人,會對170cm是高還是矮沒有概念。或是一些女生比較高的外國人,可能看到一個台灣女生身高170cm只覺得剛剛好而已。同樣一個數字,產生完全不一樣的解讀。
另外,在成績的例子裡,因為一般學校考試的過程我們都已經熟悉了,所以我最多看看考卷題目就夠了,不用特別再問考試是怎麼進行的。如果我關心的是一般研究和他的結論,那還必須去看數據收集的方法,抽樣方法或實驗設計或問卷題目之類的,甚至一些基礎的相關背景知識,而不是只是看最後的幾個滿意度總分或實驗結果而已。在沒有這些東西前,數字給我的訊息是很少的,我也只能和一般人一樣,依據一些直覺和常識和個人經驗和對該領域背景知識的了解,還有依據對方的專業背景,很粗淺的來看結論可能有道理而已。
很多人不知道:問卷設計和實驗的過程都是要真正了解那些統計數字時要關心的範圍。
量化研究中,從提出一個問題,對問題中抽象觀念的定義到設計問卷做量測中間就是個大問題了。還有些實驗設計裡,會讓人覺得他確實提供了一些訊息,但未必能得到報告中所說的這麼強的結論,除非有別的知識輔助。注意這裡面的牽扯,才會知道合理和不合理在哪些地方。(請參考:目標和量測)
有人以為念統計的人對數字很敏感,但我覺得:就是學了統計以後,反而對數字超級不敏感,常常覺得人家提供的資訊不完整,訊息量不足,根本無法下結論,也不會輕易下結論。
這是種不敏感是好的,因為本來就應該先學習了解數字背後的東西,了解一些統計的觀念,才能知道數字的意義。
這感覺就像學習語言,我們是通過這些語言去了解外國人。我們都”懂”一些字是髒字,國罵”X”、或是英文”FXXK”。有人會笑說:學一個外語最快的就是學髒字,但即使我們知道這是髒字,只有根據說話當時的語意、背景、情境、文化,才能讀出裡面的情緒有多強烈,或是只是某些人的習慣用語,或是一種愉快的打招呼用語,不然那就只是個字而已。
統計也是一種語言,是科學的一種語言。我們可以輕意讀”懂”90分這樣的數字是個分數,但是要靠更多背景去支援才能讓人真正讀到裡面的意思。而統計這種語言,各種研究、調查在用,對他有基本的認識,才可以通過這種語言去了解那些資料數字到底在說什麼。
統計和其他語言一樣,就只是一種工具,工具很好用,就看人了不了解熟不熟悉,怎樣讓它幫助你而已。現在可以有外語的即時翻譯機器,但是統計這種語言,如果不試著學一些,有可能單靠”翻譯”就明白數字背後的意思嗎?
[從維基借來統計學的定義:研究如何測定、收集、整理、歸納和分析反映資料資料,以便給出正確訊息的科學。]
有基本的觀念後,就不會用一種瞧不起的心態去想統計數字是都是騙人的,而抹滅了很多努力研究的成果,而且也不會輕易被一些對數字的解釋給唬弄過去,因為你看得出那些被提供出來的數字是訊息不足的。
數字是不會騙人的,是無知在誤導人,深深覺得基礎統計觀念的普及還滿重要的,這也就是我為什麼要寫這系列的文,希望能用這種更基本更完整的統計思惟,讓人重新看待數字和統計,減少一堆不必要的誤解。希望大家能幫忙把這裡的觀念用在生活上,或是宣傳出去。
統計對數字一點都不敏感,要討論一個數字要花時間去了解背景知識。
人對數字比統計敏感多了,好像弄個數字出來就很厲害。
來個小劇場:
人:OO國家幸福指數很高,好羡慕呀!
統計:......(你不先跟我介紹這數字怎麼來的嗎?)
人:XXXX施政滿意度只有9.2,太差勁了對不對?
統計:......(這又怎麼來的?有什麼意義嗎?)
人:XXX是米琪林一星餐廳,一定很好吃,我們去!
統計:......(大概就是很花錢的意思吧?錢不是我出吧?)
人:你說我的顏值,就算沒有十分,也有八分吧?
統計:......(就算不知道顏值怎麼評的我都覺得....=“= 我能說實話嗎?)
人:為什麼你都不回我?
統計:....…當機了 =_= 你說那些指數我都不清楚怎麼來的,所以要先做一下功課…你可以等一下嗎?話題不要跳那麼快。
文章標籤
全站熱搜