次群分析
#posthoc #subgroup #teaching
許多人都相信西洋的占星術,認為她能預測自己的運勢。依據出生日期決定的占星術黃道十二宮是白羊宮、金牛宮、雙子宮、巨蟹宮、獅子宮、室女宮、天秤宮、天蠍宮、人馬宮、摩羯宮、寶瓶宮、雙魚宮。
1988 年發表的 ISIS-2 (Second International Study of Infarct Survival) 臨床試驗顯示在病人發生疑似急性心肌梗塞之後,併用阿斯匹靈及 streptokinase 可以明顯降低再梗塞、中風及死亡的危險,但是許多人都對阿斯匹靈是否只有在某些病人(例如:年紀、性別、種族等)有效很感興趣,於是他們做了一個很有趣的分析,亦即他們把 17187 人依據占星術的星座分成 12 個次群,結果發現阿斯匹靈對天秤座、雙子座的人是無效的,但是阿斯匹靈卻能神奇地降低摩羯座的人的再梗塞、中風及死亡的危險至ㄧ半以下。可見事後分析中的次群分析是不可靠的,因為事後分析就像是「先射箭再畫靶」一樣。
-次群與暴露(治療)的交互作用(moderation)
• 這是一種觀察性研究,而不是 RCT 的主要/次要終點。
• 主要效果必須是有統計意義的。
• 如果是與連續變項有交互作用,那麼連續變項不能被變成類別/二元變項。
• 次群:必須要事先(不能事後)設定,數目不能太多,必須是基礎(治療前)的資料,各次群的樣本數愈多、愈接近愈好,各次群的共變數愈接近愈好,次群的定義沒有測量誤差,不要看太多的次群、有其他的研究支持。
• 校正干擾因子之後仍然存在。
• 必須要做多重比較的校正。
• 要看交互作用,不要分別看各次群:A 次群有意義、B 次群無意義是沒有任何判斷價值的。
• 需要的樣本數是主要效果的 16 倍:RCT 的樣本數是依據主要效果的統計檢定力 0.8 去計算的,因此交互作用的統計檢定力一定是 << 0.8 的。低統計檢定力會造成假陽性(高估效果量)和假陰性(第二型錯誤)。
• 要估計模式預測的校準與鑑別力、各次群預測的結果/治療的傷害。
• 要估計絕對與相對危險性(絕對危險性比較重要)。
• P: 0.01-0.05(不確定)、0.005-0.01(有意義)、< 0.005 (很有意義)。但是不要純粹用 P 值或用逐步複回歸選擇有意義的交互作用;要用收縮 shrinkage(懲罰 penalized、正規化 regularized、整體 ensemble)回歸選擇有意義的交互作用。
樣本數估計定義 在 肯腦濕的人生相談室 Facebook 的最讚貼文
【為什麼台灣現在,不可能有640位無症狀感染者?】
昨天寫完後才知道,何美鄉博士「無症狀感染者 640 人」怎麼算出來的,基本上是蝦七八亂掰,不值一提(而且那位日本女生是偽陽性)。不過這是個好機會,來解釋「為什麼有些數字不可能?」
〖定義無症狀感染者〗
首先要釐清,「WARS 無症狀感染者」大家的定義不太ㄧ樣。許多外國研究採取比較寬鬆的標準,乍看沒症狀就算,台灣應該比較嚴格。
照李秉穎博士的說法是這樣:
「我們自己國家的確診病例資料看來,只有5%是真的無症狀的。雖然外國的報告有人說30%有人說50%無症狀,但是我都不相信那些數字,因為他們沒有很精確主動的去問症狀,很多都是回溯式的去問他有沒有症狀,回溯式調查會有偏差,你就記不起來我最近兩個禮拜到底有沒有症狀」
何美鄉博士不重要,不要理她。反正根據國際一般標準,所謂無症狀感染者,就是感染時沒什麼明顯症狀的意思。這類感染者比例肯定超過 5%,20 到 50% 都是合理的範圍(注意這群人中,相當比例會被李秉穎博士定義為有症狀)。
《冰島追蹤武漢肺炎:重症比例極低,大量無症狀才是疫情全貌? 》
https://neanderthaldna.pixnet.net/blog/post/224727942
〖有多少無症狀,也會有多少有症狀〗
當講到比例的時候,要注意那是分子、分母 2 個數字的結果。大家都知道,樣本數愈大,會愈接近預期的機率。
以預期無症狀 50% 舉例,假如感染者只有 10 人,10 個人都無症狀確實還有可能;但是當感染者為 100 人,這 100 人都無症狀,幾乎是不可能的。
照 50% 來算,要造成 640 人無症狀,也就同時要有 640 人有症狀,總共 1280 人感染。假如照李秉穎博士的 5%,那就是 12160 人有症狀,總共 12800 人感染。
有人說,台灣因為把有症狀者抓掉,剩下都是無症狀,因此無症狀比例會比 20 到 50% 更高。此一論點,理論或實務上都是不可能的。
實務上,請問台灣過去抓掉的有症狀者在哪裡?台灣已經很長時間,帳面上沒有本土病例,根本不可能留下未知的 640 無症狀這數字。
〖感染同一款病毒,你沒症狀,他有症狀〗
理論上,關鍵在於,不同人感染 WARS 之後的症狀差異很大。同一款病毒,感染不同的人,會導致不同的症狀;沒有任何已知 WARS 病毒,會讓每個人都無症狀的。
我聽過有人講「無症狀病毒株」,完全就是蝦七八亂掰。無症狀病毒株的傳說可能和中國有關,因為中國的定義下「無症狀不算確診」,那麼要讓確診數字看起來少,無症狀自然是個方便的歸類。(武漢普篩報告一批無症狀,大概就是這樣來的)
我不是說無症狀病毒株不可能存在,但是它在哪裡?現在基因定序這麼發達,要是真的有突變讓病毒明顯變弱雞,應該不難發現。
至今只確認過一個,好像會讓殺傷力降低的突變(讓病毒少掉 ORF8 基因),但是它只是讓症狀變輕,還是有症狀,而且只出現在武漢、新加坡、台灣,4 月後就不見惹。
反倒是大量證據支持,遺傳上一模一樣的病毒,不同人感染以後,症狀差異可以非常大。如此一來,假如病毒感染上百人,怎麼可能幾百上千人,每一個都是無症狀?
要是知道 WARS 傳染與致病的基本特徵,就不會以為可能存在 640 位無症狀,卻沒什麼有症狀者;也不會誤以為可以把有症狀者抓掉,剩下都是無症狀。當 WARS 能自由傳播到,同時有幾百人感染時,上述狀況都不可能發生。
假如台灣現在有 640 位無症狀感染者,勢必同時存在,至少數百位有症狀感染者,他們就醫機率應該超過 10%,隨便一個人被送檢驗,馬上就會被發現。
但是這件事幾個月來都沒有發生,表示近幾個月來,台灣即使存在無症狀感染者,人數也應該很有限,絕對不可能到 640 人。
《嚴格的防疫管制,什麼時候才能放鬆?》
https://neanderthaldna.pixnet.net/blog/post/224694180
〖感染人數不斷變化,不可能長期維持不變〗
何美鄉博士用一人估一國,離譜到極點,何況那位日本女生檢驗的 RNA 量極低,血液也缺乏抗體,非常可能是偽陽性。反正就是蝦七八亂掰。
不論以「無症狀/有症狀」比例回推,或是考慮 WARS 的傳播與致病狀態,都可以有力反駁 640 人這個數字。
另一方面,這種(莫名其妙常見的外插)推論方式還有一個問題,那就是假設感染者和病毒是塑膠,數量都不會變化。
感染 WARS 以後,每天都有人會康復,也會有新的人感染。要長期維持和現在一樣多的感染人數,必需要傳染數 R 剛好等於 1,平均 1 個人傳染給 1 人,多一位新感染者,也有一位舊感染者康復。
假如真的「同時存在」640 位無症狀感染者,幾乎不可能長期保持 640 的數量。實際上到這個量,疫情規模肯定會持續擴大,幾週後就成長為幾千人,各國實際狀況也都是這樣。
然後還要注意,即使被誤診的可憐日本女生是真陽性,她也是很久以前感染的。如果用她來估計,她代表的其實是「她感染當下的時間」,也就是幾個月前的狀況。
如前所述,台灣假如幾個月前存在 640 位無症狀感染者,可能一直維持這個數目,沒有增加或減少嗎?可能至今為止,都沒有任何有症狀者被發現嗎?
台灣確實可能存在少數的無症狀感染者,沒有被注意到(也不需要在意)。
但是認識以上事實就能得知,假如有人認為,台灣現在有幾百、640、成千上萬、滿街跑的無症狀者的話,就當他是何美鄉,把他當作是來亂的,不要理他。
昨天寫的【WARS無症狀感染者】:
https://www.facebook.com/865377433554715/posts/3351972994895134/
李秉穎博士談無症狀:
https://www.facebook.com/…/a.110587393673684/357961992269555
ORF8 突變論文:
https://www.thelancet.com/…/PIIS0140-6736(20)31757…/fulltext