這類看醫生的經驗有一種可能:一開始問題出來大家都不確定哪裡是問題,所以醫生們從自己熟悉的方向一種種試,之前的醫生試A不行下個醫生試B, 試越多情報就越有機會找到答案。當然也是要有經驗的醫生才有辦法知道全部的可能選項有哪些、從較少的情報去刪除錯誤選項更快得到正確結論。就一個"頭痛",可能造成的原因就不知道多少...在最開始情報最少的時候,醫生要怎麼知道病因?所以我總覺得這類的評論對前幾位醫生們很不公平。
- Nov 25 Mon 2019 04:37
-
台灣評價系統~醫生沒有醫德、不專業?
不知道是不是大家都有這樣的經驗:常常有長輩朋友,抱怨有醫德的醫生很少、不夠用心、經驗不夠,自己一個病找了好多醫生做檢查沒用,最後終於問到某醫生把病治好了,於是開始大推某醫生,然後其他全部差評。
這類看醫生的經驗有一種可能:一開始問題出來大家都不確定哪裡是問題,所以醫生們從自己熟悉的方向一種種試,之前的醫生試A不行下個醫生試B, 試越多情報就越有機會找到答案。當然也是要有經驗的醫生才有辦法知道全部的可能選項有哪些、從較少的情報去刪除錯誤選項更快得到正確結論。就一個"頭痛",可能造成的原因就不知道多少...在最開始情報最少的時候,醫生要怎麼知道病因?所以我總覺得這類的評論對前幾位醫生們很不公平。
這類看醫生的經驗有一種可能:一開始問題出來大家都不確定哪裡是問題,所以醫生們從自己熟悉的方向一種種試,之前的醫生試A不行下個醫生試B, 試越多情報就越有機會找到答案。當然也是要有經驗的醫生才有辦法知道全部的可能選項有哪些、從較少的情報去刪除錯誤選項更快得到正確結論。就一個"頭痛",可能造成的原因就不知道多少...在最開始情報最少的時候,醫生要怎麼知道病因?所以我總覺得這類的評論對前幾位醫生們很不公平。
- Oct 23 Tue 2018 01:05
-
R Lesson:自定義新函數(給初學者)~函數設定改成自己常用的
即使是個R的初學者,都可以試一些簡單的方式來自定義新函數,方便自己工作:
R本身就有很多好用的function(函數),但函數的預設值未必是我們最常用的,這時候可以修改設定存成新函數名,簡少每次都要打同一串設定的麻煩,這是自定義新函數的最簡單應用。
例如:
自定義函數read.data,由read.csv改來:
> read.data <- function(file){
+ read.csv(file, row.names=1, stringsAsFactors=FALSE, na.strings=".”)
+ }
因為只有一個指令,大括號{}可省略變成
> read.data <- function(file) read.csv(file, row.names=1, stringsAsFactors=FALSE, na.strings=".”)
輸出一比資料做示範:
> write.csv(iris, file="iris.csv")
取前六筆資料和資料的structure,比較read.csv和自定義的read.data的結果:
> head(read.csv("iris.csv"))
> head(read.data("iris.csv"))
> str(read.csv("iris.csv"))
> str(read.data("iris.csv"))
1. read.csv把第一欄的數字判定為一欄變數,read.data因為多了設定row.names的指令,第一欄變成raw.names。
2.read.csv把Species當作Factor,read.data因為多了設定stringsAsFactors=FALSE的指令,文字串視為character。
PS. R裡面本身就有不少函數是這麼改出來的,像read.csv是來自read.table、paste0來自paste。
自定義新函數的一般寫法
新函數的名字 <- function(input){
對input做些運算,可能有好幾步
...
最後的指令一般是輸出output
}
- Jul 07 Sat 2018 14:05
-
我們怎能不害怕空污?
- Jul 07 Sat 2018 13:38
-
民主帶來族群對立?如何化解族群對立?
在台灣有些人羨慕一黨專政的年代(羨慕大陸或懷念兩蔣),還有很多人厭惡現在台灣各種族群對立被挑撥起,覺得很無望。寫了這篇文希望能有幫助,讓大家重新思考認識民主。
民主的運作
當人們以效率爲標準的時候,確實大陸的一黨專政可能會更好,因為民主追求的不是效率,是一種平衡。民主讓各族群的利益互相拉扯,讓國家在搖擺中緩步前進,不至於一下走上極端、大起大落,所以誰好誰壞難說。
大概因爲華人世界特別愛講效率,所以會覺得大陸好,但效率高不代表絕對的好(毀滅時的效率可能也會很好),所以在某個角度上大陸也是在走鋼索。在某些問題上,太重視效率,壓縮思考的時間,反而容易犯下大錯,事後要花更多時間彌補----效率不該是唯一標準,過度重視效率反而是個問題。
很多國家不看重效率,也很多採用民主制(執行的方式各有不同),台灣的民主制確實有病需要修正,但那不代表民主制是不好的,每個國家也都是這樣慢慢修,還要因應時代進步帶來的新問題。
很多政策修改本質就是利益重新分配,所以總有人開心、總有人不滿,所以吵吵鬧鬧,這點世界各國都一樣。但在關心這種吵鬧後,能依法行使權力表態,不會自己一直糊里糊塗被犧牲不自覺----這是民主給我們的力量。
現在台灣已經是民主制了,只有學習使用民主的力量來改善台灣,了解民主不是只有選舉時去投票、隨便複述一堆毫無幫助的批評、無意中在幫助族群分裂。就像法律只保護懂法律的人,民主也只給懂民主、會去行使權力的人力量。 我們已經讓有心人搶了先機,在大家爲經濟奮鬥不認識民主時,誤導大家民主政治的意義、製造各種族群分裂、讓台灣沒自信,所以我們更要盡快思考、學習、了解各種思考上的邏輯謬誤、討論問題能就事論事、真正認識民主制和它的精神,行使權力,把它調整回來。
化解族群對立
認識民主的用意是「各族群的利益互相拉扯,讓國家在搖擺中緩步前進」後,對於族群對立和內鬥的問題推測一下可能發生了什麼事:
首先,不管哪個國家,每次政策改革本質上都是一種利益重新分配。如果沒有先正確認識民主的運作和用意,人們就只會關注自己的損失。特別是人們對自己有利時容易忽視,覺得一切來的理所當然,只有利益受損時才會關心抗議,因此每個人都覺得自己在讓利、是受害者,這種心態很容易就被人教唆或無意間挑起族群對立,接著族群對立就越演越烈。
如果這段推測還算合理,只要適當時機提醒身邊的人們注意民主本身就一種輪流做莊的感覺,應該能削弱週圍族群對立的心態、對不同立場的人多一點寬容。(但是不應用在自己有利、對方讓利時說這個來要求對方讓利,故意引發對立。) 重點是自己能認識到「我們不是受害者」,「我們現在過的生活是在不同族群幫助下得到的」。
一日之所需,百工斯為備:借用生物多樣性的想法,一個生態系統中的生物網越複雜時,生態系統越穩定平衡,不會因為一點小小的外力,或因某個物種消失就整個毀掉。人類的社會本身就像一個生物網,越複雜越穩定,出來什麼問題都能找到合適的人來解決,每一份工作都有重要性,社會能夠健全的運作,是因為大家各斯其職。(因為每個人個性不同,可以讓自己不高興做的工作有人樂意做,不是很好嗎?)
我們的生活圈都太狹小,所以很容易對沒有機會接觸到的職業因為不了解而忽視,但是也不能隨便給別人貼「米蟲」的標籤。像那些做理論數學的有什麼用?沒人看得懂他們在做什麼,想應用都用不上,很少人有辦法直接了解,但那些不重要嗎?我們的科技就是在這種很難懂的理論底下慢慢發展出來的。
所以在民主制裡,我們本就要有所犧牲讓利來換取更大的利益,不是只看到自己的犧牲,別人可能犧牲更多。好的運作,有可能讓不同族群各取所需,得到雙贏局面。
但是要注意:如果制度會讓同一群人持續犧牲讓利,是有病的制度,應該改掉。看看美國的例子:他們各州人口密度差距大,城鄉人口差距也大,如果採用一人一票等權的方法就會有病,因為多數的人集中在城市,多數決會犧牲鄉村的利益,會很容易犧牲掉一些人口稀少的州、拉大城鄉差距,就會成為有病的制度。所以他們祖先設計了一套非常複雜的方式來衡量不同州的票數,接著川普就上台了(若以一人一票來算,他就不會當選了),但他們仍持續這種複雜的計算。
因此,一個好的制度理論上應該避開持續犧牲某一族群利益,不然某一些群體可能會消失(因被過度犧牲而消失、被徹底無視而離開)。以此來看:高度和諧人人滿意的社會反而是民主的警訊。(如果一個地區,重視某方面發展,有一群人覺得生活越來越好了,另一群人被犧牲得不到機會,只好到外地找工作,單就一個城市可以說城市特色,但一個國家都這樣問題就大了,某些工作都沒人做,又一堆人搶同樣的工作,整個社會平衡被打亂,怎麼辦?)。
所以,吵吵鬧鬧才是民主該有的樣子。只是該怎麼吵、怎麼討論才能雙贏、能讓對立雙方凝結一些共識,在差異的地方協商讓步,這就是另一個問題了。當然很重要的是要先牢牢記得「一日之所需,百工斯為備」,我們能過上現在的生活是在不同人群幫助下得到的。
- Jun 30 Sat 2018 01:31
-
真的領先世界廢核?還是以火力代核電是倒退路?
在過去很長的時間裡,我們被非專業的灌輸核電輻射的恐怖,但隨著空污越來越重,跳電越來越凶,核能該被人們重新認識學習。
台灣的廢核議題(2025非核家園)實際上是火電vs核電的二選一問題。因爲台灣能源潰乏加上科技的限制,目前只有核電和火電能供應穩定的電力滿足用電需求。第三個選擇是「不要用電」,相信只有極少數人願意走這條路。
如果懷疑台灣只有這三個選項,可以先去了解各種發電方式有什麼科技上的限制、無法處理的缺點。像是效率上,其他再生資源發電在台灣都像時有時無的臨時工,而且多生的電還存不下來(如何儲電也是大問題),唯有火電核電穩定的提供電力。
有些時候我們不知道哪個方法好、也不懂背後的理論時,可以參考別人是怎麼選的:各國對核電和火電的態度:那些用核能的國家急著廢核嗎?那些還在用火電的發展中國家想不想用核能?能不用核電的先進國家具備哪些條件,我們具備嗎?還有誰在大量用火電?
所有方法都有缺點,發展更好的綠能本就是全世界共同的希望,只是目前其他方法都不夠好到能供應先進國家「穩定電力」,因此除了少數再生資源非常豐富的國家,其他資源不足且電需求大的國家會使用核電,暫用核電等待研究更好的綠電本就是這些國家使用的方案---這也是「以核養綠」公投想做的事。 核電在世界也被認為是潔淨能源,幫助減碳,阻止全球暖化和極端氣候的幫手。比起輻射和核廢料(已有處理方法),看著每年各種暴風、暴雨、強乾旱、持續高溫、持續低溫....碳排放才是更讓世界各國擔心的問題(所以才要求各國控制碳排放)。
所有方法都有缺點,發展更好的綠能本就是全世界共同的希望,只是目前其他方法都不夠好到能供應先進國家「穩定電力」,因此除了少數再生資源非常豐富的國家,其他資源不足且電需求大的國家會使用核電,暫用核電等待研究更好的綠電本就是這些國家使用的方案---這也是「以核養綠」公投想做的事。 核電在世界也被認為是潔淨能源,幫助減碳,阻止全球暖化和極端氣候的幫手。比起輻射和核廢料(已有處理方法),看著每年各種暴風、暴雨、強乾旱、持續高溫、持續低溫....碳排放才是更讓世界各國擔心的問題(所以才要求各國控制碳排放)。
即使有些國家訂定廢核計劃,也都隨時觀望調整政策,不敢急著把廢核的時間說死,有的國家是一再改口把時間往後推,甚至有些國家廢核後後悔又重新用核電(包含經歷核災後的日本,燃氣成本過高又改用核電)。德國雖已廢核但那也是在能跟鄰居法國買核電、人民也願意付高額電費的前提下。我們能跟誰買呢? 為什麼我們要急著自斷核能的路呢?
另外可以看看世界最大的幾個火電廠都在哪?台中火電廠在2006-2017十年居世界第一,去年才被大陸內蒙超越屈居第二,但大陸早意識到火電問題而積極發展各種發電技術包含核能技術,且正狂蓋核電廠。
看著中南部嚴重的霧霾和電壓不足、跳電,2025非核家園真的是領先世界廢核?或其實「以火力取代核電」是各先進國都不願走的倒退路?
若有時間願意關心發電的議題,比較核電火電,可以試著了解:
1.有多少疾病和空污有關(肺癌持續居癌症榜首,因台灣地型氣候導致中南部會成為重災區)
2.各種輻射劑量對身體的影響 (推薦書:怕輻射不如先補腦)
3.認識核災 (核災不是原子彈爆炸,核能不是核武,核災如果如流言中那麼恐怖,核電不會是被各先進國普遍接受的方案)。核災分幾級(核災像第震一樣,每一級有對應的安全措施。核電廠內的員工才是要害怕,但他們是核能專業,他們願意支持核能,更會小心保命,廠外的我們要怕什麼?)
4.一座核電廠的供電能換幾座火電廠、產生多少核廢?核廢有什麼科學方法處理?
多了解後或許就能明白爲什麼沒有國家以火電取代核電。
最後用了一個最直接簡單的比法:先不考慮成本(成本核電較低)。
假設我家就在台中火電廠或核四廠隔壁,對我們影響最嚴重的分別是什麼?
下面是我的答案:
假設我家就在台中火電廠或核四廠隔壁,對我們影響最嚴重的分別是什麼?
下面是我的答案:
1. 核電:最大問題是「萬一」發生大型的核災(小問題核電廠有安全機制,完全不關我們的事),有輻射外洩時可能須暫時徹離居住區,等確認輻射量安全後回來 (不過如果是地震等原因帶來的核災,我家應該先核電一步被震垮,也沒有回家的問題了),可以吃碘片防甲狀腺癌,甲狀腺癌本身就是極低發病率和極高治癒率。 (因為不是核電員工,核災也沒機會觸到高劑量輻射。)
2. 火電:最大問題是「時常」要和空污為舞,易得肺癌(極高發病率,極低治癒率,這幾年為台灣十大死因第一名中的第一名)、心血管疾病。 且已證實空污會使該地區居民平均壽命較短。
對我而言核電風險較小的----我會偏好核電。
核電不完美,但我們目前沒有更好的選擇。核能就像煉鋼石化一樣,是一項很重要的技術,應該學習研究利用。現在本該爲未來十年後電力做規劃,想蓋電廠也不是馬上蓋馬上能有電,今天的決定可能影響未來20年。各國目前仍願給核電機會,重視核能,為什麼我們要急著在這十年廢核、完全不給核電機會?
「以核養綠」公投案要收集三十萬人聯署,期限只到八月底,迫在眉睫,需要大家盡快連署。希望招呼親朋好友參與,連署後也不是就能用核電,只是爭取保留使用核能的機會。
整理了一篇講空污的問題在哪:我們怎能不害怕空污?
對核災有恐慌,請先了解,核災不是原子彈爆炸,參考重大核災介紹。
連署請看以核養綠公投網頁 https://www.green-nuclear.vote
對核電核四因不了解而憂慮,請上「以核養綠公投」FB詢問。
PS 這篇可能會再稍微修改完善,但核心想法是不會變的:有些議題因立場價值觀而難斷優劣,但在廢核議題裡,風險成本比較上,「核電勝火電」是幾個科學領域綜合結果得到的事實,這事實也大約反應在各電需求大的國家對核電、核能研究的態度----核電不完美,但目前沒有更好的選擇。
- Jun 24 Sun 2018 02:36
-
台灣評價系統~從特殊事件看社會問題:一個情殺案就能和XXX問題有關係?
我非常反對從某些極端個案去討論各種社會問題。
每次發些什麼事件,就會有很多「專家」出現,想把各種個案牽扯到某些社會問題上,然後說,就是因為這樣的社會問題會導致這種悲劇,所以要注意這些社會問題~The End。
最近看到的是從情殺案牽到沙文主義和家暴,所以就先以這個為例子吧。
其實能從殺人案突然接到「傳統沙文主義是本事件和其他殺人事件的主因」,跳躍有點大。我理解的沙文主義是一種男權至高無上,單從「求愛糟拒就施暴」這點無法判斷這個人就是沙文主義還是因失敗而施暴。有可能就是辛苦討好女生花很多錢和心力,女生持續曖昧不明,結果突然被拒,無法接受失敗而施暴,這樣還算沙文主義嗎?
那麼,我也可以認為事件主因是「社會和個人都對失敗和犯錯的容忍度太低」,他是因無法面對突然來的巨大失敗挫折而走上極端的個案。畢竟在面對挫折失敗或外界攻擊時,人很容易開始一種保護模式(變刺蝟),具有殺傷力或攻擊性,只是每個人的攻擊模式不一樣。一般而言,越成熟的人越有辦法調整自己在各種挫折時的心態和攻擊性。
而對於男性攻擊女性的議題我也可以推測是來自男女「攻擊模式」有差異。
理由 1.男女的武力值天生就是有很大的落差。
理由 2.當要用武力攻擊比自己武力值大的人,多數人應該會多思考一下或是放棄。
以此推測男性對女性較易用武力(懶得或不擅長動口),而女性對男性較擅長使用言語的攻擊(或其他不著痕跡的攻擊)。如果女生增強武器裝備,把武力值提到超越男生,可能就不只有男性攻擊女性的事件了。另外,有些男性很「斯文」遵守著絕不對女生動手的原則,那他們就比較不會攻擊女生嗎?未必,他們只是改用言語暴力而已。
武力造成的傷害是明顯實質的傷害,看起來傷口雖重,但看得見,而言語傷害是不留痕跡,無法量測,長期累積下也能把人逼瘋。(突然想到一部電影:「閃靈(The shining,1980)」,喜歡恐怖片的朋友可以看看,我把它歸類為婚姻關係的影片——看一個家庭崩潰的過程。)
例如,家暴可能有家暴遺毒(註:看著大人都是這樣攻擊人,小孩子長大也會這樣攻擊人),會成為社會問題。
我認同有機率發生家暴遺毒的說法。但更準確的說,有些人受過傷害後,會去用同樣的方式傷害,但有些人受過傷害後反而會更小心,不讓自己用這種方式傷害人,還有些人生活家庭看起來再美滿再正常不過,但就是個殺人犯(請參考韓國電影殺人回憶和大陸的白銀案)。也就是不管來自正常或不正常的家庭,人都有可能走到極端成為殺人犯,而那都是千萬分之一的機會。
極少有人的人生是非常順利、沒有經過任何苦難的。有心的話,去研究任何一個人,我們都能找到一段不好的經歷,然後說,他就是因為這個經歷使他變成現在這樣。
因此,我更反對把這種個案和家暴做連結,有點像在故意強化「家庭有問題的小孩長大都會有問題」的印象,社會的這種刻版印象會對小孩不公平。而在我的觀察裡,人從「受害者」轉變成「加害者」的一個很重要的轉換開關是來自「社會(週圍的人)的不公平待遇」。也就是說,一般受害者是不會變成加害者的,通常是在遇到社會各種不公平待遇後才會轉變。即使是再正常的人,在受到各種不公平待遇,都會走向極端的。
而社會持續檢討這種個案後,把原因推到家暴身上,又沒去有效解決家暴問題,反而持續強化家暴遺毒的印象...這不是再把受到傷害的人們從「受害者」轉變成「加害者」,開始持續惡性循環嗎?
所以,我非常反對從某些極端個案去討論社會問題。要討論家暴就單獨討論家暴和研究怎麼解決、怎麼幫助他們。不要總是發生了事件,就從這些個案來說家暴或其他問題很重要,然後就沒了。(OS:不用那些個案我們也知道這些問題很重要,須解決。)希望更多人注意到這種模式產生刻板印象會造成社會的不公平。
- Jun 21 Thu 2018 06:24
-
思考邏輯~探討因果關係中,基礎的背景/專業知識的重要
先以「台灣就是太民主了,所以越來越亂」這句話為例:
可能常常有人會抒發「台灣就是太民主了,所以越來越亂」的感慨,接著就看到論點利用「犯罪率」越來來低來否定台灣越來越亂這件事,進一步否定「台灣就是太民主了,所以越來越亂」這句話。我覺得這是一個好例子來看:為什麼有時候明明講到點上了,卻無法說服更多人?
首先,因為「越來越亂」是主觀感受,什麼殺人、犯罪率並不是「亂 」的唯一指標,當使用犯罪率來當亂的唯一指標的時候,就類似「使用不適當的工具做量測標準」(參考:目標和量測)。隨著時代變化犯罪方式轉變,例如詐騙越來越多、因失戀而傷人的人變多、一堆似是而非的謠言在傳、很多造成族群分裂的思維在散布...對很多人來講這樣就叫「亂」了,不是只是犯罪率的問題。所以,依照不同標準,我們可以同時說出「台灣越來越亂」和「台灣在進步」完全相反的話,就像「一代不如一代」和「長江後浪推前浪」同時存在一樣。有些人會開玩笑說活在「平行世界」裡,大約就是這麼回事。停留在這種階段的討論我覺得比較沒意思,很難重擊對方的論點,也無法有力支持己方的論點。
回來看「台灣就是太民主了,所以越來越亂」這句話。當有人說出這句話時,說明他心裡認為:1.台灣太民主。2.台灣越來越亂。3.上述兩者有因果關係。
如果要推敲:第1點屬於爭議較少的事實。 (但對話或前後文中,應該要提到什麼叫「太民主」)
第2點,前面已經講過,這個要爭有得爭,只是是無關痛養的爭執,對大家都沒什麼幫助。在我眼裡,所有議題持續在這種階段的爭執裡,也是「台灣越來越亂」的一種表現。應該把「台灣越來越亂」修改成更具體一點的描述再討論(把覺得亂的點列出來討論)。
第3點即使上述兩點都是對的,因果關係的探討還是非常不容易,而且關聯性的議題一定要從背景知識下去探討。
像這個命題最重要的背景知識是:任何制度都存在一些問題,那麼民主帶來了什麼問題 (從歷史和世界各國來看)?(民主有什麼特色?民主有什麼特殊影響?)有這些認識之後才討論台灣某些問題是不是民主造成的。任何討論沒有先在這一個問題上釐清、有共同認識的話,不管想支持或不支持這種因果存在,這個討論會越吵越沒意思,變成「抒情文」(指純粹抱怨或為反駁而反駁/為攻擊而攻擊的文)。
背景知識有這麼重要?
如果要推敲:第1點屬於爭議較少的事實。 (但對話或前後文中,應該要提到什麼叫「太民主」)
第2點,前面已經講過,這個要爭有得爭,只是是無關痛養的爭執,對大家都沒什麼幫助。在我眼裡,所有議題持續在這種階段的爭執裡,也是「台灣越來越亂」的一種表現。應該把「台灣越來越亂」修改成更具體一點的描述再討論(把覺得亂的點列出來討論)。
第3點即使上述兩點都是對的,因果關係的探討還是非常不容易,而且關聯性的議題一定要從背景知識下去探討。
像這個命題最重要的背景知識是:任何制度都存在一些問題,那麼民主帶來了什麼問題 (從歷史和世界各國來看)?(民主有什麼特色?民主有什麼特殊影響?)有這些認識之後才討論台灣某些問題是不是民主造成的。任何討論沒有先在這一個問題上釐清、有共同認識的話,不管想支持或不支持這種因果存在,這個討論會越吵越沒意思,變成「抒情文」(指純粹抱怨或為反駁而反駁/為攻擊而攻擊的文)。
背景知識有這麼重要?
在科學上,像抽煙導致肺癌、空污導致各種疾病...這種因果關係的推論,都有理論背景在運作(只一些專有名詞化學物理反應等等,一般人較難懂),然後都用了統計數據支持(比較易懂),最後就產生了一種,要有數據才有真相的感覺,而讓人忘了那些理論背景的重要。但事實是,純粹的數字或統計方法從來都無法證明因果關係。請記得兩件事:
一、統計數據可以去幫助證明有沒有關係(關聯性),但沒辦法證明因果關係。(有關係和有因果關係是不一樣的,因果關係的推斷一定要有背景或專業理論上的支持、或是實驗支持,才有辦法得到。)
二、也是要有背景知識或專業理論上的支持下,統計數據證明出的「兩者有關聯性」才有意義。
事實上,即使是在能夠量化的議題裡討論因果關係,文獻回顧和專業的探討也都是第一重要的事。 因此,像這種因果關係的論述,背景知識的缺乏會讓討論半天也沒成果(即使是具有邏輯性的討論)。
如果只是閒聊,聽到「台灣就是太民主了,所以越來越亂」的感慨,可以問對方為什麼覺得越來越亂?為什麼覺得是太民主的關係?來幫助大家弄清問題在哪,把敘述修改得更精確。(具體作法就是一直問自己/對方「為什麼這麼想」就好了。)
而大部份議題我們只是讀者,做為讀者我覺得:文章(或討論串)卻缺乏對議題背景的了解或邏輯性時,就可以純粹當抱怨文或抒情文瞎看看就好,不要看更好(避免洗腦)。而也就是說,身為讀者的我們也必須先具備某些背景知識和邏輯性才有辦法。
最簡單判斷背景知識足不足夠,可以看對"關鍵字詞"的定義有沒有較精確的認識。像這個議題裡,對民主和其他制度的比較、民主的特色(優缺點)在哪裡、民主的起源發展演變...是背景知識;對於不了解台灣、不是生長在台灣的人,"台灣的社會亂象"有哪些也會成為必要先了解的背景。另外,好一點的論述會避開意義模糊的字眼(像「亂」是模糊的概念),或是對有爭議的字下一個定義才探討 (限縮要探討的主題,把「亂」限定指「治安不好」)。
有一些作者知道大部份人缺某個知識,會先補充說明,但是不建議完全依賴這樣的補充說明,因為作者寫文章有目的性和主要論點,所以補充的背景知識容易不完整或偏重在某個點上。 讀者還是要先找一些介紹比較基礎廣泛的背景知識,或看同一議題各種不同觀點的文章(必須是不同觀點或立場的文章),較有幫助。
最後記得:即使全台灣乃至全世界的人都一致強調(這裡指缺乏邏輯性或背景知識論點下複誦):「台灣就是太民主了,所以越來越亂」(或「台灣就是民主,所以能做到這樣」) ,也無法對他們的主張提供一點點有力的證據。
如果只是閒聊,聽到「台灣就是太民主了,所以越來越亂」的感慨,可以問對方為什麼覺得越來越亂?為什麼覺得是太民主的關係?來幫助大家弄清問題在哪,把敘述修改得更精確。(具體作法就是一直問自己/對方「為什麼這麼想」就好了。)
而大部份議題我們只是讀者,做為讀者我覺得:文章(或討論串)卻缺乏對議題背景的了解或邏輯性時,就可以純粹當抱怨文或抒情文瞎看看就好,不要看更好(避免洗腦)。而也就是說,身為讀者的我們也必須先具備某些背景知識和邏輯性才有辦法。
最簡單判斷背景知識足不足夠,可以看對"關鍵字詞"的定義有沒有較精確的認識。像這個議題裡,對民主和其他制度的比較、民主的特色(優缺點)在哪裡、民主的起源發展演變...是背景知識;對於不了解台灣、不是生長在台灣的人,"台灣的社會亂象"有哪些也會成為必要先了解的背景。另外,好一點的論述會避開意義模糊的字眼(像「亂」是模糊的概念),或是對有爭議的字下一個定義才探討 (限縮要探討的主題,把「亂」限定指「治安不好」)。
有一些作者知道大部份人缺某個知識,會先補充說明,但是不建議完全依賴這樣的補充說明,因為作者寫文章有目的性和主要論點,所以補充的背景知識容易不完整或偏重在某個點上。 讀者還是要先找一些介紹比較基礎廣泛的背景知識,或看同一議題各種不同觀點的文章(必須是不同觀點或立場的文章),較有幫助。
最後記得:即使全台灣乃至全世界的人都一致強調(這裡指缺乏邏輯性或背景知識論點下複誦):「台灣就是太民主了,所以越來越亂」(或「台灣就是民主,所以能做到這樣」) ,也無法對他們的主張提供一點點有力的證據。
- Jun 09 Sat 2018 13:44
-
統計二三事~邏輯陷阱:倖存者偏差
「倖存者偏差(Survivorship bias)」是一種邏輯陷阱,先介紹一個小有名的故事:
二戰期間,對於「戰機應該如何加強防護,才能降低被炮火擊落的機率」的問題美軍開起了調查,一種很簡單的想法:戰機上哪裡彈痕多就表示被擊中的機率大,應該加強防護,而資料裡機翼的彈孔多於機尾的。但統計學家沃德力指出更應該注意彈痕少的部位,因為那些部位被擊中的戰機,樣本只有來自返航的---機尾的彈孔少不是因為不容易中彈,而是中了彈的就回不來了,應該加強機尾。
忽略了那些不容易看到的情況進行推論,就容易犯下「倖存者偏差」。
另一個有名的例子是1987年美國獸醫學會發表「貓從六樓以上摔下來反而存活率更高」的論文,開啟了「貓落地」的研究,然後有了假說:「高樓層讓貓有機會調整姿勢」。後來有人指出:「活著的貓才會被送到獸醫院,低樓層沒受傷的也不會送到醫院」。再更多的研究後有了結論----還是要提醒貓奴們不要給主子墜樓的機會!
另一個有名的例子是1987年美國獸醫學會發表「貓從六樓以上摔下來反而存活率更高」的論文,開啟了「貓落地」的研究,然後有了假說:「高樓層讓貓有機會調整姿勢」。後來有人指出:「活著的貓才會被送到獸醫院,低樓層沒受傷的也不會送到醫院」。再更多的研究後有了結論----還是要提醒貓奴們不要給主子墜樓的機會!
其他比較有名的例子:在火車上調查有沒有買到車票(搞笑?)、成功的人都很努力所以只要努力就能成功(缺少失敗的人的訊息)、老建築都很有風格 (好的才被保留下?)、某某某產品很有用(比較少人會主動去提覺得沒用的產品?)。多留心的話,生活中帶有這種偏差存的例子不勝枚舉。 (也歡迎大家提供生活中倖存者偏差的例子給我。)
在統計裡這是抽樣偏差。我們要處理資料一定會先了解資料怎麼來的,或是想怎樣收集資料較好,就是在思考樣本有沒有偏、能不能對想研究的問題做推論。
在現在這樣取得資料太容易的時代,偏差更嚴重,雖然較容易收集到大量的資料,但是這種資料反而容易漏掉某群「不易觀察的個體」,而這些群體其實具備了某種共通點,有偏的樣本在分析下結論時會產生一些限制。有時利用較嚴謹的抽樣方法可以避開偏差,(雖然抽的樣本數較少、但會多花些時間人力金錢去觀察不容易得到的個體);有時這種偏差是不得已的,這時候對於推論的範圍要特別謹慎。
在現在這樣取得資料太容易的時代,偏差更嚴重,雖然較容易收集到大量的資料,但是這種資料反而容易漏掉某群「不易觀察的個體」,而這些群體其實具備了某種共通點,有偏的樣本在分析下結論時會產生一些限制。有時利用較嚴謹的抽樣方法可以避開偏差,(雖然抽的樣本數較少、但會多花些時間人力金錢去觀察不容易得到的個體);有時這種偏差是不得已的,這時候對於推論的範圍要特別謹慎。
最後,當我們不斷轉述二戰的故事時,警惕倖存者偏差時,又犯了一個錯誤。
了解倖存者偏差可以避開錯誤的結論,但無法直接用它找到正確的結論。再回到二戰的故事,它本身也是邏輯上有問題的故事。這個故事顯然是為了介紹倖存者偏差的觀念編寫,而簡化了一個最重要的環節----如果沃德只依靠倖存戰機的彈痕和幸存者偏差的觀念,就得到機尾才應該加強防護的結論,這叫「瞎猜」。除了戰機上彈痕的分布,沃德肯定還有別的研究資料或背景知識加入(例如向飛行員們調查他們害怕哪裡中彈),才能得到這樣的結論。科學上的結論,絕對不是一組數據或是眼見為憑這麼簡單的,但個人很容易放大自己看見的東西來下結論,我們只能時時警剔避開「倖存者偏差」以及「濫用倖存者偏差去下結論」。
PS 像這樣的邏輯問題在科學研究裡不分文組理組都超重要,回想在國中高中的階段,沒有特別重視邏輯這一塊,或是網路新聞媒體太多邏輯不嚴謹說法,讓我們思考越來越缺乏邏輯性,希望未來這塊的訓練能被重視。重點是,當你"相信或不相信"一些訊息前,能先去關心背景由來,留心這樣的結論過程是不是在邏輯上有多少瑕疵;另外,很多時候人們只是在抒發一種情懷,不用較真。
小結:重要的重複三次:
認識倖存者偏差能避開錯誤的推論,但無法直接用它去下正確的結論。
認識倖存者偏差能避開錯誤的推論,但無法直接用它去下正確的結論。
認識倖存者偏差能避開錯誤的推論,但無法直接用它去下正確的結論。
認識倖存者偏差能避開錯誤的推論,但無法直接用它去下正確的結論。
- May 29 Tue 2018 10:57
-
R note: 文字串相關 迴圈讀存檔
- Sep 17 Sun 2017 14:00
-
[電影]林肯傳(背景和心得)~思考一個國家領導須具備什麼?

2012年林肯傳上映的時候,在電影院裡看到最後很多美國人都在哭,可惜我當時對美國歷史政治完全不了解,看影片也大多沒看懂,所以沒什麼心得,只注意到很多美國人在哭,也留下林肯真的很偉大的印象。後來終於有字幕重看了一遍,再到處google,才開始慢慢了解整個歷史背景。這部片對台灣人可能難懂,但是我卻反覆看了好幾遍,就想找一個問題的答案:一個讓好幾代人不斷懷念景仰的偉大國家領導人,具有什麼特質?為什麼這麼多美國人看哭了?
- Aug 14 Mon 2017 10:46
-
R Lesson: 函數中有一堆設定要修改? ( )中的潛規則
餵資料給函數是有一些可以讓你偷懶的小規則的,知道規則以後,就可以就隨便餵了。
一般函數都不須要餵太多東西,所以平常不會感覺到什麼差別,但是有些函數可能用上很多arguments,或是arguments的名字很長,那就有些偷吃步了。
這時候就要借助繪圖函數了,單純因為他們的arguments比較多,比較好舉例。
下面以長條圖barplot()為例,先看?barplot的Usage:
barplot(height, width = 1, space = NULL,
names.arg = NULL, legend.text = NULL, beside = FALSE,
horiz = FALSE, density = NULL, angle = 45,
col = NULL, border = par("fg"),
main = NULL, sub = NULL, xlab = NULL, ylab = NULL,
xlim = NULL, ylim = NULL, xpd = TRUE, log = "",
axes = TRUE, axisnames = TRUE,
cex.axis = par("cex.axis"), cex.names = par("cex.axis"),
inside = TRUE, plot = TRUE, axis.lty = 0, offset = 0,
names.arg = NULL, legend.text = NULL, beside = FALSE,
horiz = FALSE, density = NULL, angle = 45,
col = NULL, border = par("fg"),
main = NULL, sub = NULL, xlab = NULL, ylab = NULL,
xlim = NULL, ylim = NULL, xpd = TRUE, log = "",
axes = TRUE, axisnames = TRUE,
cex.axis = par("cex.axis"), cex.names = par("cex.axis"),
inside = TRUE, plot = TRUE, axis.lty = 0, offset = 0,
add = FALSE, args.legend = NULL, ...)
長條圖裡有很多東西可以改,而且這還不是全部,當一個函數最後放上 ... 的時候,就表示還有一些額外的arguments可以用。
而且是只有第一項height沒有任何預設值,其他argument都接上等號,所以這個只要第一項放入數據就能跑了。
下面借了example裡的例子。
> (tN <- table(Ni <- rpois(100, lambda = 5)))
> barplot(tN, col = rainbow(20))
example裡 rpois()是隨機產生100筆資料的函數,pois 表示Poisson分布。
然後用table整理了一下,看看0,1,2,... 各有幾個。然後就叫barplot畫圖,設定了一下顏色 col。
[統計小知識:Poisson分布是離散型變數的第二大代表。一小時內訪問某店的客人數量就是一種Poisson的資料,也是一種計數的資料。忘了離散型變數?Lesson 1提了一次,離散型變數是畫長條圖,不適合畫直方圖喔!]
- Aug 14 Mon 2017 07:10
-
R Lesson: 一般資料匯入R必殺技:read.csv()
想用R處理資料的時候,第一個問題都是:如何把手上的資料弄進R裡?
這邊只先介紹表格形式的資料,像Excel表那樣的排列(其實一般接觸到的都是這種格式。)
確實有時候把手邊的資料弄進R裡是有一點麻煩或是須要一點經驗,特別是遇到Excel格式的資料。如果不是非常必要,請不用浪費時間去找"直接讀入Excel檔"的方法。
有R-studio的話,就直接在視窗裡選 file > import dataset > From Excel ...
選完想要的檔案、物件名、sheet和其他設定之後,把code preview裡的程式存到文件稿裡,之後就不用再重新點選設定,直接跑code就可以了。
選完想要的檔案、物件名、sheet和其他設定之後,把code preview裡的程式存到文件稿裡,之後就不用再重新點選設定,直接跑code就可以了。
其他格式檔案(SAS、SPSS...)匯入也可以這麼用。
library(readxl)
Data <- read_excel("filename.xlsx")
View(Data)
Data <- read_excel("filename.xlsx")
View(Data)
readxl就是目前用來直接讀Excel檔的package...但過去讀Excel檔的package都不是長期有效,常常一年半載後就要重新找package,還滿麻煩的,希望這個package能活很久囉...
另外下載package來用的缺點就是有些package過一段時間可能會因為各種原因失靈,而R的內建函數通常不管過多久都能好好的。
所以這裡另外提一個用R基本的內建函數,簡單幾乎萬無一失的方法,也不用另外加載package:
把資料存成csv檔,然後放在R工作目錄所在的資料夾裡,然後在R裡輸入read.csv("filename.csv")都不會失敗。
而read.csv裡面還有其他更多設定可以改。
R所在的工作目錄不知道的話...在R裡輸入getwd() 就知道了。
> getwd() # get working directory
[1] "/Users/supercat"
把filename.csv檔放在資料夾"/Users/supercat”裡。
這時候,如果你在R裡輸入 dir(),應該要看到你想匯入的檔案名,如果沒有,就是放錯資料夾了。
> Data <- read.csv("filename.csv")
當然也可以無視工作目錄輸入完整的路徑
> Data <- read.csv("/Users/supercat/filename.csv")
