統計與生活 沈冠甫 財務金融系
目錄 實驗設計的基本概念 隱藏性變數 混淆變數 控制干擾因子 太極拳運動 減肥藥的臨床實驗 第壹部:數據來源 第三章 : 實驗設計與實驗性資料 P52
3.2 維他命 C 可以預防感冒嗎? P 導讀 P52 實驗性資料是以實驗法所測得的資料, 目的是想要探討實驗前與實驗後的因果關係。 背景:美國化學家鮑林( Linus Pauling) 得過兩次 諾貝爾獎在 1970 年的實驗 比較 : 維他命 C VS 安慰劑 方法 : 將 279 位受試者隨機分成兩組 (how?) 其中 139 位 在試驗期間服用維他命 C , 140 位在試驗期間服 用 安慰劑以人為對象做實驗 : 臨床試驗 (Clinical Trials) 結果:服用維他命 C 的人感冒的比例較服用安慰劑的人少 了 10 %
維他命 C 可以預防感冒嗎? P53
水中加氟降低患蛀牙的機會? P53 時間:民國六十一年至七十五年 地點:中興新村 ( 加氟 ) VS 草屯 執行單位 : 臺大牙醫學系與臺灣省政府 結果:中興新村的兒童蛀牙比草屯少了 40 %至 60 % 瑕疵:中興新村跟草屯兩地的居民生活在一 起,實際上沒有明確的界線,如何確 定中興新村的小孩只喝中興新村的水, 草屯的小孩只喝 P53 改善:兩個地區不但一般居住、生活條件要 相似,實際距離也要隔很遠,確保兩 個地區完全不受干擾草屯的水 P54
控制組 P54 目的:為了確認實驗組的效果 ( 因果關係 ) 方法 : 實驗組與控制組所有條件均相同,只有處理的不同 - 維他命 C vs. 安慰劑、加氟 vs. 不加氟 原因:沒有控制組就沒有辦法去比較這個實驗是不是有效
安慰劑 P54 功用:不含藥效成分的東西,是一種假的治療 目的:排除安慰劑效應安慰劑效應自我治療的心理效應 身體自然抵抗與洽療的效果 比較:安慰劑 VS 新藥 例如:疼痛新藥試驗或憂鬱症新藥試驗 比較 P54 一切均為相對 – 不是服用維他命就不會感冒,而是感冒的比例較服用 安慰劑為低 – 不是不抽煙就不會得肺癌,而是得肺癌的比例較抽煙 者為低 – 不是打疫苗就不會得新流感,而是得新流感的比例遠 較不打疫苗者為低
無控制組的臨床試驗 控制組的臨床試驗 例子
解釋變數與反應變數 p55 解釋變數:預期可以造成反應變數有所變化的 變數如服用維他命 C 與否 – 又稱處理 (Treatment) 反應變數:用來度量研究結果的變數 : 如感冒與 否 個案或受試者 (Subject) p55 個案:實驗中研究的對象 例如: 279 位參加維他命 C 試驗的個案、 中興新村及草屯兩個地區的兒童
處理 (Treatment) p55 處理:任何加諸在研究對象的特定實驗條件 例如:服用維他命 C 或服用安慰劑水裡加氟或 水裡不加氟 隨機分組 (Randomization) p55 目的 : 平衡一些看不到的干擾因子 平衡 : 身高、體重、血壓、疾病歷史 方法 : 丟銅鈑或電腦程式 ( 如 :Chow and Liu- Designand Analysis of Clinical Trials, 2ndEdition, 2004, John Wiley and sons)
維他命C與感冒 的隨機分組 p55 農作物多組實驗 的隨機分組 p56
雙盲實驗 (Double-blinded Trials) p56 第一個盲性:受試者 第二個盲性:醫生 Results of Patient’s Guess on Treatment for the Prophylactic Use for Common Cold 目的:避免評估所引 起主觀的偏差
統計顯著性 (StatisticalSignificance) p57 問題 : 如何確定服用維他命 C 的人感冒的比例 較服用安慰劑的人少了 10 %是真的 ? 樣本結果⇒母體族群 原始假設:假設試驗組跟控制組是沒有差異 P值:原始假說設在可以計算的基礎上,然 後去計算試驗結果發生的機率 * 第十三章會詳細介紹 - 統計推論
P值 p57 P值大,表示得到這個實驗結果的可能性很大 ,認定和一般隨機現象差不多,可以接受原始 假說「試驗組跟控制組是沒有差異的」P值很 小,表示如果原始假設成立,而卻得到這樣的 試驗結果的機會非常的小,顯然不是隨機現象 可以解釋,拒絕原始假設
台北縣市讀報紙社論的人數比例 p58 台北縣市教育程度的人數比例 p58
人民教育程度與讀報紙社論人數比例 p58
3.3 隱藏性變數 p58 隱藏性變數:研究中其它變數可能有重要 影響,但未被列為解釋變數的變數 例如:台北縣 / 市教育程度比例不同 * 隱藏性變數的例子
國家首長施政滿意度的高低 p59 1. 民眾的政黨認同:有些人是按照自己的政黨認同來 決定滿意度 2. 選民的投票意向:選民把票投下去之後,會觀察這 個首長當選前後的表現 3. 民眾所在地區的屬性:有些地方民眾滿足感的門檻 可能較低,而有些地方的居民比較難滿意 3.4 混淆變數 p59 混淆變數:會影響反應變數,卻跟其他解釋變數 混在一起而無法區分的變數 例如:民眾的政黨認同、選民的投票意向、民眾 所在地區的屬性
混淆變數的例子 p 控制干擾因子 1. 完全隨機設計 (Completely randomized design) 2. 配對設計 (Matched-pair design) 3. 區集設計 (Randomized block design)
完全隨機設計 p60 完全隨機設計:所有的實驗個體都是隨機配置 給全部的處理方式 例如:將學生隨機分成兩組,一組考試時放輕鬆 的音樂,另一組則正常考試,考完比較兩組成 績,檢驗考試時放輕鬆音樂是否有效 * 例子:新產品的顏色跟形狀 p61 顏色:粉紅色、銀白色和 乳白色三種 形狀:橢圓、長條和圓盒三種 方法:找了十八家商店隨機 分配給這九種處理方式
配對設計 p61 配對設計:用來比較兩個處理方式,把兩個 處理方式隨機分配給一對類似的受試對象, 或是一前一後分配給同一受試對象 例如:某研究機構隨機抽樣了 500 對結婚 30 年以上的夫妻,分別隔離詢問他們對興建 核四發電廠的態度是贊成還是反對,然後 檢驗夫妻看法是否一致
例子:健康食品的實驗 p61 方法:選取成對的受試對象,同一對的所有背景都盡 量相似 ( 包括性別、年齡、教育程度、身高、 體重、血壓 ) 隨機分配:一個進入試驗組,一個進入控制組 區集設計 p62 區集設計:依據某一外在影響變數,將試驗單位區分 為若干區集,然後再觀察不同的 處理方式對反應變數的影響效果 例如:為了避免性別因素干擾試驗結果,先把所有的 試驗者分成男性和女性,然後在每個性別再隨機分 成實驗組和控制組進行實驗
例子:新玩具的組合 p62 顏色:白色、黑色 形狀:長條形、圓柱型 地區:商業區、工業區、文教區跟農村區 方法:在不同的地區 ( 干擾因子 ) 分別找商店隨機分 配給這四種處理方式 3.6 實例應用 ( 一 ) :太極拳運動 p63 目的:探討太極拳運動對提高老年族群平衡能力的功效 實驗組:常年從事太極拳運動的 25 名老年人 對照組:不運動的同齡健康的 25 名老年人 結果:實驗組受試者的平衡能力明顯優於不運動的對照組
實例應用 ( 二 ) :減肥藥的臨床實驗 p63 對象:蒐集身體質量指數 BMI 超過 27 以上的 人 比較:減肥藥 VS 安慰劑 結果:服用減肥藥體重下降 (18 % ) ,服用安慰 劑體重下降 (9.5 % ) 減肥藥的效果 p63
統計結緣 George Box 因家窮只好就讀化學職業學校時, 碰上第二次世界大戰,被分派到軍中化學防禦 武器研究站。在加達姆爵士 (Sir John Gaddum) 手下研究毒氣的解藥。 研究站中蒐集了相當 多的實驗數據,由於當時 找不到統計學家,他的上 司將分析數據的工作交由 Box 負責,開始了他的統 計研究生涯。 統計人物小傳 George Box(1919 ~ )
George Box 與上司的對話 Box :這些數據變化太大了,我們應該請統計學 家來幫忙分析這些數據 上司:我知道,可是現在連一個統計學家也找不 到,你對統計了解多少 Box :我對統計知道的不多,但是我有讀過費雪所 寫的 “ 研究工作者的統計方法",大概可以 知道作者想做什麼 上司:那好,既然你讀過這本書,就照書上的做 法試試吧
George Box 與加達姆爵士的相遇 Box( 士官 ) 的單位打算撰寫一份關於路易士毒 氣 (lewisite) 解藥研究的報告,作者是位陸軍 少校 (major) Box 負責撰寫論文附件中統計有關部份 ( 試驗採 用配對設計 ) 報告完成後,負責審核的長官堅持刪除 Box 所撰 寫的附件,因為內容太困難了,沒有人會看得懂
George Box 與加達姆爵士的相遇 加達姆爵士卻看到完整版的論文,有一天他興沖 沖的跑來找 Box ,本想要恭賀他那篇精彩的附件, 卻聽到這部分要從正式的報告中剔除。 怒氣沖沖的加達姆爵士帶著 Box ,闖入正在組合 屋 中舉行的論文審查會議,當著所有評審委員的面 前,對著這些委員說:『把這優秀的文章放進報 告裡!』 (Put the bloody thing back in) ,他 們馬上就照做了。
總結 基本觀念 變數 – 解釋變數 – 反應變數 – 隱藏變數 – 混淆變數 實驗設計 – 完全隨機設計 – 配對設計 – 區集設計 實例