close
今天工作收到很好的回饋!主要是看到一個非常好的例子可以給一般人介紹一個概念:為什麼明明是很重要的因子卻選不進模式裡。希望計畫結束後能具體介紹這個例子給更多人,今天先說故事。
===故事開始===
一個半月前,組裡收到了一個舊計畫的提問。雖然是舊計畫,但是主題是新的,主管就說:這問題我也不熟,看Scientist怎麼說,你就幫他們弄吧!
一開始要求很簡單,只是有幾個選好的模式,現在要做預測,另外有個部份他們不確定之前的分析是怎麼做的,想讓我看一下。但我是新接手,而整個實驗過程很多步驟很複雜,跑實驗的Scientist很耐心反複跟我解釋發生什麼事,多次後我都聽得很灰心了,結果他還寬慰我:沒事,連我們組其他Scientist不做這個計畫的人也大多沒搞懂發生了什麼事。
雖然不懂一些具體的過程,但是對資料的敏感度還是有的,有一個模式我覺得會有問題就跟他們提要排除掉部份樣本重建。一般情況下每個資料點都是心血結晶,就算在統計上是明顯的異常點,如果沒有明確的理由,是不會刪的。但最後他們同意讓我減少樣本但新增一個因子重建模式。
模式是重建了。另外,實驗過程中有一個步驟是稀釋,對於稀釋的過程他們有較明確的公式,為了處理另一個問題,稀釋算法也給我了。結果看完稀釋算法,我覺得有些因子應該要先變形再進模式裡,今天一開會就跟他們說我有新想法要重建模式,主持計畫的scientist只好問我:妳有多少想法?
我OS: 我也沒辦法呀,現在有新的情報進來,能修正的自然要修正。
還好她的語氣是開心的。其實實驗一年多前就結束了,雖然初步的報告也有,但是因為實驗過程複雜,雖然有很多細部的資料,但是束手無測。而對我來講,處理這些資料中最麻煩的不是整理推導公式建模,而是了解他們在做什麼,然後要怎麼讓對各種數學式很頭大的Scientist了解出了什麼事、為什麼要這麼弄,最後還要看我的想法和他們的認知有沒有不一致。即使到現在,實驗過程我可能只懂了三成。之前和他們討論兩三次,常常都沒有辦法把想法好好傳達出去,很困擾。這次雖然也是小討論,但有關鍵點,所以我和比較熟的Scientist討論了幾次、修改ppt,才再和主持計畫的scientist重新討論,希望那些理論公式不要防礙他們理解。
他們的資料有很有趣的現象:在沒有應用背景知識下建模,有一個最重要的影響因子會被踢掉。如果p-value小一些,例如0.15,還能怪是樣本數太小,但p-value卻高達0.9,用樣本數太小來解釋說不過去,一般遇到這種情況是很難跟Scientist說,為什麼在他們眼裡是關鍵的因子卻無法進到模式裡,弄不好還有人覺得統計是唬人的吧。但是參考了稀釋算法,應用一些公式重新把因子轉換後再建模,該選的都選了,模式也都合理了。雖然沒有背景知識的模型解釋能力很高、也能做預測,但是有一些背景公式下去建模才能有合理的解釋。最後我跟他們提議:希望這個例子能借給我們組,以後就可以跟其他人解釋有沒有提供背景知識給我們差多少。如果沒有額外的資訊,就不要再怪統計方法沒有選到重要的因子。
跟他們介紹完,感覺主持計畫的Scientist特別開心說:「有你在我們太幸運了」「我希望之前有好好學統計,可以分析自己的資料、享受這些有趣的發現。」是的是的,所以我也很喜歡跟Scientist合作,很多實驗過程遠比一般人想像還辛苦,但是資料很有價值,而現在最辛苦的實驗有人幫我做了。像這個實驗一筆資料就要整整四天去弄,但是因為他們對分析資料工具和能力有限所以往往沒辦法榨出更多信息----嗯...正好給我玩。
新工作三個多月後心得:我覺得離開癌症臨床實驗改進早期研發的決定是對的,雖然據說比較沒錢途,但和Scientist合作工作內容真的很有趣。
文章標籤
全站熱搜