「道理聽了很多,依然過不好一生」?
 
我們在一邊說話/閱讀/聽一邊思考時很容易缺乏邏輯性,很少有人會提醒這點,平時自己也缺乏避開邏輯謬誤的練習,花太多時間去吸收或說服別人,卻很少靜下來把自己的想法完整有系統的整理清楚。這些使我們的想法處處有漏洞,常常「又要馬兒好又要馬兒不吃草」而不自覺,「言行矛盾」而不自覺,而且搞不清自己心裡最重要的價值觀是什麼(信念不明確),容易聽了很多道理依然不知所從、做出不是自己真心想要的選擇,而在公眾議題的討論上易演變成無建樹的爭執。

在吸收各種的道理後,花時間思考整理,釐清各種道理和自己價值觀,才能幫助人生做好選擇。這邊介紹幾個可以在吸收別人的道理時,可以常常拿來問自己的問題。這是我平常拿來問自己的問題,但直到最近才能把較具體的方式完整寫出來,願對朋友們能有所幫助,不至於道理越聽越迷茫。
文章標籤

霹靂貓 發表在 痞客邦 留言(0) 人氣()

這是來自知乎裡的一個問題:該不該告訴自己我很優秀?山羊月的答案
(推這一篇文章,也可以看看其他人的評論,討論是一群人的想法交流,遠比只看一個人的想法有意思多了!!!)
 
把這個問題列為第0篇,是因為這個問題在我的世界裡是接近基石的存在。很多問題矛盾糾結不知道怎麼辦才好,看越多意見越混亂,就是因為沒有先知道:道理是要有條件的。而即使我再努力想把我的道理的條件補上,也是沒辦法寫清楚的。念數理的人應該有經驗:記定理的結論不難,但是前面的條件有一大堆,弄清什麼時候定理成立才是大問題;在統計裡也是:一個方法要能被用是有一些條件和假設才能用,資料結構不符合,就是誤用。可惜的事,科學世界可能能把條件整理出來,人世間的道理卻是很難的。如果把這個概念濃縮成六個字,可能就是:道可道,非常道。
 
文章標籤

霹靂貓 發表在 痞客邦 留言(0) 人氣()

最近半年練習使用R的一些之前沒用過的pacakge。一個是R的data.table package,有其特殊的方言,可以處理更大的資料。

另外就是把Rshiny 往更複雜的結構去。試著寫了幾個module,和幾個loop搭配。
試驗的還算順利。

覺得像打電動一樣,R的經驗用往上了一個level。可以考慮弄一個自己的系統。

文章標籤

霹靂貓 發表在 痞客邦 留言(0) 人氣()

雖然嘗試了幾次tidyverse和pipe,但語法的改變並沒有讓我覺得有特別大的好處,R v.4 開始有pipe,合適的時候還是會用一下。

然後找到一個package "data.table" 處理大資料,可以一定程度簡化一些code,開始學習和測試。

學習新東西的過程還是很折磨人的,本來用base R 很熟練的寫法現在,要轉成新的方式。
但因為data.table似乎確實能幫助處理大資料,我還是慢慢練了。

 

霹靂貓 發表在 痞客邦 留言(0) 人氣()

回填、修正資料是很正常的,並不是修改資料就是造假美化數據。因為不是所有量測都像填個網路問卷調查直接匯整成很好的資料格式直接分析,生物化學很多實驗做完要等樣本分析結果出來要時間,(也不是只等一台儀器出結果而已),匯整輸入資料複查確認修正也要處理時間。
理想上我也希望資料齊全確認無誤後才開始分析。但有些問題就是分析時才容易看到,這時就是要讓登錄整理資料的人回去查原始檔案,有時候是樣本的結果就這樣,偶爾會發現有錯要改。好像很多人覺得回去改資料有問題,但是錯了不改怎麼辦呀?
像新名詞「校正回歸」這種回溯確診病例甚至都稱不上修改資料,就是補齊資料而已。一般會先訂好以哪個時間點為準,例如就依照檢驗時間計算,要等幾天才會知道今天的結果。塞車的情況下,時間差會越拉越大。這跟一些即時監控分析的情況完全不一樣。因為處理過程時間差的關係,很難有正確的即時病例數,當天想知道的即時病例數要事後才能整理出,但事後就只要研究累積數病例和累積治數癒就夠了。
文章標籤

霹靂貓 發表在 痞客邦 留言(0) 人氣()

二月初接的計畫,在這週一完成一次口頭報告,向scientists們和我的主管報告目前的分析方法和結果,大家對這樣的方法和結果都很滿意,之後就可以開始寫報告了。
 
持續跟我合作、跟我修slides和練習的scientist在我的口頭報結束後私底下跟我說:Amazing。因為我們本來估計一個小時的會議可能不夠,可能還要再找時間討論,主要大家對新流程和新方法不清楚會有很多問題須要討論。結果我三十多分鐘就講完了,大家都了解出了什麼事,為什麼這樣改,也沒有什麼問題。而且他覺得我節奏長握的很好,雖然報告時間比預計短,但也沒有很倉促的感覺 (嗯...其實問題真的沒有這麼複雜,真正Amazing的是我週末準備的大抄。
 
這個計畫想知道如何在一個新的程序下控制好產品中的賦形劑和滲透壓因為過程有很多步驟, 如果不把這些步驟拆開來討論,最終的滲透壓不容易估準確。因此,這次做了一個比較複雜的model,要先把過程切成三階段各別探討後再拚接起來,再合成一個完整的模式圖-----其實一開始我也不清楚要怎麼做好,但弄著弄著,就變成這樣了。我對目前的結果還覺得有點小遺憾,因為我對濃縮過程有一部份不了解,如果能知道濃縮效果放進模式裡,整個模式還會有改善空間,但Scientists們覺得現在預測的結果已經好到驚人了,所以希望能開始收尾了,畢竟…總是一個研究問題會帶出另一個問題,我們只能在一個範圍內先釐清,其他的以後再說吧。
文章標籤

霹靂貓 發表在 痞客邦 留言(0) 人氣()

一直很少介紹R的基本畫圖函數。很多人會用ggplot2的套件,但是我學R畫圖的時候ggplot2沒有,ggplot可以很快畫出複雜維度的圖,但是我更喜歡自己設計圖,我常常是調整很多參數都要動一遍,雖然我也用了一點qqplot2,但是一般都是用basic裡的指令。對我來講自己畫圖的好處就是不用加載太多套件,自己想怎麼畫就怎麼畫。
 
?par 裡有非常大部份畫圖參數設定的介紹
 
par(mfrow=c(2,2), mar=c(5,4,2,3), las=2)
文章標籤

霹靂貓 發表在 痞客邦 留言(0) 人氣()


新病毒出來後,一天到晚在報確診人數增加其實很無趣,畢竟確診人數會先反應測試速度,而且不管政府做不做假,確診人數和真實病毒散布情況永遠有個難已研究的差距,使確診人數成為乍看有意義其實信息不多的數據。這種時候,像影片中的模擬研究對我們認識問題更有幫助。


下面影片可開中文字幕:這樣的模擬,雖然不會跟我們說這次的病毒怎麼散布、防治的成效如何,但確更好幫助我們對各種傳染病散布和人類採取措施的關係有了解。是一個很好的模擬研究的例子,不須要太多的背景知識應該都能了解。

文章標籤

霹靂貓 發表在 痞客邦 留言(0) 人氣()

今天工作收到很好的回饋!主要是看到一個非常好的例子可以給一般人介紹一個概念:為什麼明明是很重要的因子卻選不進模式裡。希望計畫結束後能具體介紹這個例子給更多人,今天先說故事。
 
===故事開始===
一個半月前,組裡收到了一個舊計畫的提問。雖然是舊計畫,但是主題是新的,主管就說:這問題我也不熟,看Scientist怎麼說,你就幫他們弄吧!
一開始要求很簡單,只是有幾個選好的模式,現在要做預測,另外有個部份他們不確定之前的分析是怎麼做的,想讓我看一下。但我是新接手,而整個實驗過程很多步驟很複雜,跑實驗的Scientist很耐心反複跟我解釋發生什麼事,多次後我都聽得很灰心了,結果他還寬慰我:沒事,連我們組其他Scientist不做這個計畫的人也大多沒搞懂發生了什麼事。
文章標籤

霹靂貓 發表在 痞客邦 留言(0) 人氣()

這週組裡討論了一下Data scientist和我們Statistician的差別。
 
網路上常用一張圖來描述Data scientist,但我對它有點意見。
那張圖能用來描述資料科學須具備1.程式設計2.統計數學3.相關領域知識,但還讓機器學習和統計的關係變得很詭異。
 
文章標籤

霹靂貓 發表在 痞客邦 留言(0) 人氣()