「道理聽了很多,依然過不好一生」?
 
我們在一邊說話/閱讀/聽一邊思考時很容易缺乏邏輯性,很少有人會提醒這點,平時自己也缺乏避開邏輯謬誤的練習,花太多時間去吸收或說服別人,卻很少靜下來把自己的想法完整有系統的整理清楚。這些使我們的想法處處有漏洞,常常「又要馬兒好又要馬兒不吃草」而不自覺,「言行矛盾」而不自覺,而且搞不清自己心裡最重要的價值觀是什麼(信念不明確),容易聽了很多道理依然不知所從、做出不是自己真心想要的選擇,而在公眾議題的討論上易演變成無建樹的爭執。
在吸收各種的道理後,花時間思考整理,釐清各種道理和自己價值觀,才能幫助人生做好選擇。這邊介紹幾個可以在吸收別人的道理時,可以常常拿來問自己的問題。這是我平常拿來問自己的問題,但直到最近才能把較具體的方式完整寫出來,願對朋友們能有所幫助,不至於道理越聽越迷茫。

霹靂貓 發表在 痞客邦 留言(0) 人氣()

這是來自知乎裡的一個問題:該不該告訴自己我很優秀?山羊月的答案。
(推這一篇文章,也可以看看其他人的評論,討論是一群人的想法交流,遠比只看一個人的想法有意思多了!!!)
 

霹靂貓 發表在 痞客邦 留言(0) 人氣()

最近半年練習使用R的一些之前沒用過的pacakge。一個是R的data.table package,有其特殊的方言,可以處理更大的資料。
另外就是把Rshiny 往更複雜的結構去。試著寫了幾個module,和幾個loop搭配。
試驗的還算順利。

霹靂貓 發表在 痞客邦 留言(0) 人氣()

雖然嘗試了幾次tidyverse和pipe,但語法的改變並沒有讓我覺得有特別大的好處,R v.4 開始有pipe,合適的時候還是會用一下。
然後找到一個package "data.table" 處理大資料,可以一定程度簡化一些code,開始學習和測試。

霹靂貓 發表在 痞客邦 留言(0) 人氣()


回填、修正資料是很正常的,並不是修改資料就是造假美化數據。因為不是所有量測都像填個網路問卷調查直接匯整成很好的資料格式直接分析,生物化學很多實驗做完要等樣本分析結果出來要時間,(也不是只等一台儀器出結果而已),匯整輸入資料複查確認修正也要處理時間。
理想上我也希望資料齊全確認無誤後才開始分析。但有些問題就是分析時才容易看到,這時就是要讓登錄整理資料的人回去查原始檔案,有時候是樣本的結果就這樣,偶爾會發現有錯要改。好像很多人覺得回去改資料有問題,但是錯了不改怎麼辦呀?

霹靂貓 發表在 痞客邦 留言(0) 人氣()

二月初接的計畫,在這週一完成一次口頭報告,向scientists們和我的主管報告目前的分析方法和結果,大家對這樣的方法和結果都很滿意,之後就可以開始寫報告了。
 

霹靂貓 發表在 痞客邦 留言(0) 人氣()


一直很少介紹R的基本畫圖函數。很多人會用ggplot2的套件,但是我學R畫圖的時候ggplot2沒有,ggplot可以很快畫出複雜維度的圖,但是我更喜歡自己設計圖,我常常是調整很多參數都要動一遍,雖然我也用了一點qqplot2,但是一般都是用basic裡的指令。對我來講自己畫圖的好處就是不用加載太多套件,自己想怎麼畫就怎麼畫。
 
?par 裡有非常大部份畫圖參數設定的介紹
 
par(mfrow=c(2,2), mar=c(5,4,2,3), las=2)
plot(1:30, pch=1:25, col=1:10, cex=1.2, las=1,
ylab=" ", xlab="lab", main="figure",
panel.first={
rect(par("usr")[1], par("usr")[3], par("usr")[2], par("usr")[4], col="gray80")
abline(h=seq(5, 30, by=5), lwd=2, lty=1:6 ,col="white")
# grid()
})
axis(side=4, seq(5, 30, by=5), label=1:6, las=1)
 
par("usr”)   
給出圖框x軸和y軸最小和最大的位置。
rect() 畫一個矩形。
axis() 畫軸。
 
mfrow=c(2*3), 
一頁面有2*3張圖,畫圖順序先上下後左右,如果改用mfcol=c(2*3),則是先左右後上下。
par裡另有fig可以指定圖畫在頁面上的哪個位置。另外兩個可指定多張圖排板方式的是函數 layout() 和split.screen().
 
mar=c(5,4,2,3)   
每一張圖下左上右外圍各保留5,4,2,3行距離。也可以用mai,單位會變成inch.
 
las=1   
軸標和軸的關係:保持水平顯示。
預設值是0:和軸成水平。2: 和軸成重直。3: 保持重直。
 
panel.first
在 panel.first 裡的指令會先執行,最後才會畫畫主要的30個點,這是一個簡易調整畫圖順序的方法。
 
pch: point character 點的形狀
col: color 
lty: line type
lwd: line width
 
(未完)

  • plot



  • matplot



  • boxplot



  • hist



  • points



  • text



  • mtext



  • title



  • axis



  • rect



  • abline



  • qqnorm, qqplot



  • image



  • contour



  • rug



  • jitter



  • par



  • layout


  • 霹靂貓 發表在 痞客邦 留言(0) 人氣()


    新病毒出來後,一天到晚在報確診人數增加其實很無趣,畢竟確診人數會先反應測試速度,而且不管政府做不做假,確診人數和真實病毒散布情況永遠有個難已研究的差距,使確診人數成為乍看有意義其實信息不多的數據。這種時候,像影片中的模擬研究對我們認識問題更有幫助。
    下面影片可開中文字幕:這樣的模擬,雖然不會跟我們說這次的病毒怎麼散布、防治的成效如何,但確更好幫助我們對各種傳染病散布和人類採取措施的關係有了解。是一個很好的模擬研究的例子,不須要太多的背景知識應該都能了解。

    霹靂貓 發表在 痞客邦 留言(0) 人氣()

    今天工作收到很好的回饋!主要是看到一個非常好的例子可以給一般人介紹一個概念:為什麼明明是很重要的因子卻選不進模式裡。希望計畫結束後能具體介紹這個例子給更多人,今天先說故事。
     
    ===故事開始===

    霹靂貓 發表在 痞客邦 留言(0) 人氣()

    這週組裡討論了一下Data scientist和我們Statistician的差別。
     

    霹靂貓 發表在 痞客邦 留言(0) 人氣()

    Rplot1.png
    之前幫忙臨床實驗時遇到一個很有趣的問題:要估算要開多少site收病人,才能在合理的時間內達到需要的病人數(當然這也跟經費有關)。
     

    霹靂貓 發表在 痞客邦 留言(0) 人氣()

    親友看到有關資料分析的文章覺得有點怪就轉給我看:
    文章主要分析了一組數據,想說明這是假數據(某政府又再次造假了!)。
    看完後我只能說:這文章沒法證明某政府的數據有多假,倒成了典型的「科學和統計知識不足下的分析評論」。
    論點一大概是說:
    死亡率太穩定,所以數據是假的。仔細看會發現,這個穩定跟大數法則的穩定不是一回事嗎?(他挑的時間點樣本數都在7000以上了)。作者當然沒有提到大數法則,但真數據依大數法則也是這樣的穩定。
    依該文章的邏輯:數據符合大數法則所以數據是假的 (!!!!???? WTF!!! 照這邏輯所有研究都不用做了...)

    霹靂貓 發表在 痞客邦 留言(0) 人氣()

    Blog Stats
    ⚠️

    成人內容提醒

    本部落格內容僅限年滿十八歲者瀏覽。
    若您未滿十八歲,請立即離開。

    已滿十八歲者,亦請勿將內容提供給未成年人士。