close
所謂的"量化"研究有多重要?其實就跟考試有多重要差不多。
考試這個東西,就是統計上的一種量化、量測方法。學習情況、學習能力這些東西是抽象的,沒有工具量測,所以我們用"考試"來幫助了解小孩子的學習情況,例如針對數學能力,得到的數學成績,就是小孩子的數學能力的量化。而一般研究比較抽象議題的時候,我們靠問卷,問卷的作用跟考卷是差不多的。這種量化值可以用來幫助個體了解自己的狀況,也可以幫助研究者了解整個群體的情況。
考試這個東西,就是統計上的一種量化、量測方法。學習情況、學習能力這些東西是抽象的,沒有工具量測,所以我們用"考試"來幫助了解小孩子的學習情況,例如針對數學能力,得到的數學成績,就是小孩子的數學能力的量化。而一般研究比較抽象議題的時候,我們靠問卷,問卷的作用跟考卷是差不多的。這種量化值可以用來幫助個體了解自己的狀況,也可以幫助研究者了解整個群體的情況。
但真正在做量化研究時,題目設計非常重要,要能夠問出研究者所關心的事。一般新設計的問卷是要先測試的,就是設計完要試用看看,題目清不清楚?會不會有”誘導”答案的現象?有沒有辦法真的量到我們所關心的問題?填問卷的人有沒有亂答?......總之,把抽象概念定義清楚到量化的過程也是一門學問,問卷設計和實驗設計都很重要。
然後我們就想到,考卷也是一樣的道理。只是一般學校的考卷很單純,因為他限縮在一個”考試範圍”內,來評量學生”這一段時間"的學習成果,並不完全代表”能力”。而要了解成績分數到底有多高的參考價值,細著看,要去看考卷的問題才知道,畢竟不同學校不同老師有時候有不一樣的出題重點和風格。如果不細究,有些很具規模有公信力的考試,是非常費心去設計出來的而且能測出”能力”,至少像”托福"這種考試,我覺得它確實有一定衝量英文能力的作用。(不過托福是注重學術英文的量測上,其他考試檢定我沒接觸過就不提了,相信有不少有公信力的。)
所以成績分數,你可以說它很重要,因為他是一個參考值,也可以說它不重要,因為他就是個參考值。統計數字就是這樣的,像之前提的假設檢定的p值(1)概念,它就是個參考值,不必要過度看重或追求,但也不能輕視它暗藏的訊息。
看到這類的參考值,重點是:我們有沒有辦法"讀到"這個值背後的意思,而不是神化它或是貶低它。
要了解分數背後的意思,有時候必須去看問卷問了什麼問題,考卷問了什麼問題,到底有沒有真正的”量測”到”你以為"的那個”數學能力”、”英文能力”、”滿意度”、”幸福指數”,很多時候研究者或出題者定義的目標和用來量測的問題,或是一些實驗設計的方式,可能和你想的不太一樣。
要了解分數背後的意思,有時候必須去看問卷問了什麼問題,考卷問了什麼問題,到底有沒有真正的”量測”到”你以為"的那個”數學能力”、”英文能力”、”滿意度”、”幸福指數”,很多時候研究者或出題者定義的目標和用來量測的問題,或是一些實驗設計的方式,可能和你想的不太一樣。
教改的「失敗」和「成功」到底是怎麼定義、怎麼衡量的?
理論上,教改的失敗和成功是要依照教改及教育的「目標」下去判斷的,而且要有適當的量測方法去評價。
先來看一下我編的小故事:有一家庭,父母希望小孩子長高一點,每天給他食補運動想讓他增高,也常常給他量身高做記錄。有一天,父母覺得小孩是長得比一般小孩子高了,可是就是太瘦了不夠壯,所以想換個食譜和運動方式,想讓孩子長壯一點,接著還是天天給小孩子量身高做記錄,過了幾個月發現換了新的食譜後,身高就沒有再長了,就抱怨新的方法很爛、很失敗......
這是一個目標已經改成"長壯",結果還在用身高做量測的很瞎的故事。 (驚!!!!) 真的有這麼傻的事嗎!!!!!!
我們隨口在說教改失敗的時候,大約就是犯了這樣的錯:教改的目標和我們用來評價教改成功與否的標準是不一致的。研究重量卻用公分來描述、研究體積用公斤來看....這看起來是很誇張的錯誤,但是最初在說教改失敗的時候,差不多就是用這種方式在「妖魔化」教改。
例如:如果教改的目標是「多元化」,而多元化是指「希望每個人在自己感興趣和擅長的領域上專心發展,讓人人往不一樣的方向發展,使各行各業發展更蓬勃」,結果整個社會和家長們一直用過去「總分要越高才好,各科都好才行,醫學院要第一志願」的想法來看,當然會指責教改,而且每個小孩子都要把"更多元”的內容塞進腦子裡,越補越辛苦,更沒有空去專心在自己感興趣的領域上。但這並不是教改的本意。新政有新的目標,很多就是希望能讓人民能轉變一些觀念想法 (從這個點來看,教改可能真的是失敗了)。
教改有”新的目標”在那裡的,結果我們評論教改好壞的時候用傳統思維、教改前的那一套,那新制是不可能比舊制好的,impossible!!! 這樣一看,教改會失敗的原因,其實是「不思考不學習不改變的社會大人們」,一直用舊的評價標準來衝量教改,然後把一切過錯推給學校教育和教改…
教改有”新的目標”在那裡的,結果我們評論教改好壞的時候用傳統思維、教改前的那一套,那新制是不可能比舊制好的,impossible!!! 這樣一看,教改會失敗的原因,其實是「不思考不學習不改變的社會大人們」,一直用舊的評價標準來衝量教改,然後把一切過錯推給學校教育和教改…
教改在這裡只是個例子而已。所有的改革都是遇到這樣的問題,都有一些新的目標,”新與舊的對立”,但是到底”新”的有沒有比較好,光看他不符合”舊”的標準批評他是不行的,這樣一定會怎麼看怎麼不順眼,所以新政一出來總會經過一些陣痛和衝突。
不採用新的方法就是不創新不進步?用了新政又一天到晚嫌東嫌西?然後最後就說這些政策都是收賄、都是要圖利某些人。當然是要"圖利"沒錯,新舊政策跟據他們的優缺點本來就是會對一群人有好處而造成另一群人的損失,人都是"對自己有利時一直誇,對自己有害時一直罵",不管是要罵要誇,希望我們選的是真正的對"整體(包含現在與未來)"更好一些的路。以後要看新政策的好壞,我們是不是可以先更了解一些事情再下去思考討論:
1. 要解決的”目標問題”是什麼?
有些問題本身是不適當的,有時候有"更基本、更重要、更迫切"的問題要先處理才對。
2. 針對問題的解決方法(新政)合不合理?有沒有副作用?
有些方法很瞎就是因為提的方法根本解決不了問題、治標不治本。
還有些方法"隱藏的危害"不小,讓人不能冒然行動。這世界幾乎沒有一種方法是零缺點的。
3. 應該用什麼方式來衡量成果和副作用?
不要只把舊的評價方式,直接套用來說新的方法不好。
如果有不好的副作用,有沒有機會減輕那些傷害。
然後就可以開始看看"一例一休"、"Uber"、"教改"、"非核家園"…這裡面到底發生什麼事了,不要再隨別人的說法起舞了。
1. 要解決的”目標問題”是什麼?
有些問題本身是不適當的,有時候有"更基本、更重要、更迫切"的問題要先處理才對。
2. 針對問題的解決方法(新政)合不合理?有沒有副作用?
有些方法很瞎就是因為提的方法根本解決不了問題、治標不治本。
還有些方法"隱藏的危害"不小,讓人不能冒然行動。這世界幾乎沒有一種方法是零缺點的。
3. 應該用什麼方式來衡量成果和副作用?
不要只把舊的評價方式,直接套用來說新的方法不好。
如果有不好的副作用,有沒有機會減輕那些傷害。
然後就可以開始看看"一例一休"、"Uber"、"教改"、"非核家園"…這裡面到底發生什麼事了,不要再隨別人的說法起舞了。
====統計的日常生活====
統計的世界對抽象的名詞和概念是須要盡量定義清楚,避免產生誤解矛盾。
人的世界嘛…反正大概知道在講什麼就好了,仔細探究處處充滿矛盾。
來個小劇場:
人:統計統計,霹靂貓超乖的、超級孝順的,希望我的孩子也跟他一樣。
統計:你的乖和孝順是什麼意思?
人:就是……他超聽父母的話,凡事都和他爸媽商量,隨時都會想到父母。
統計:如果這樣來衡量孝順的話,他確實孝順,但你確定用這樣衡量孝順沒有問題嗎?
人:有什麼問題?
統計:你知道傳說中的「媽寶」嗎?
人:知道呀,媽寶超討厭的,一點主見也沒有,超依賴父母,父母把他們養這麼大了都還一點獨立思考判斷的能力都沒有,也沒辦法承擔自己的責任……這種人怎麼對的起父母呀!
統計:所以「媽寶」是怎麼定義的?
人:就是有些人超聽媽媽的話,凡事都要和媽媽商量,隨時都會想到媽媽…...
統計:所以根據你的定義和量測方法,霹靂貓是個很乖很孝順很討人厭又對不起父母的媽寶,你希望你的孩子也跟他一樣嗎?
人:=_=///
========
另外,一般人非專業立場來思考:教育有問題真的是因為教改嗎?
請參考:台灣特有評價系統~教改
文章標籤
全站熱搜