不同插補法在網路成癮量表之差異研究 研 究 生:郭旻東 指導教授:王曉玫 博士 嶺東科技大學 資訊管理與應用系 碩士論文 研 究 生:郭旻東 指導教授:王曉玫 博士 中華民國 101年 06月 25日
大綱 緒論 文獻探討 研究方法 研究結果 結論與建議 中華民國 101年 06月 25日
緒論 中華民國 101年 06月 25日
遺漏資料問題 樣本遺漏值(missing data)的產生 樣本資料減少 不同量表所適用之插補法各有不同 受測者作答不慎、疏忽問項、不明瞭題意而拒絕填答 樣本資料減少 降低估計的有效性 造成推估上的偏誤 不同量表所適用之插補法各有不同 中文網路成癮量表修訂版 (Chinese Internet Addiction Scale - Revision, CIAS-R) 中華民國 101年 06月 25日
研究問題與目的 研究問題 研究目的 探討不同插補法在不同遺漏型態資料與無遺漏的完整資料之分析結果比較 以所建議的最適插補法對完整資料分析,提供輔導學生網路成癮的參考依據 研究目的 找出最適切用於網路成癮量表的插補法 有效協助目前及未來網路成癮相關研究 中華民國 101年 06月 25日
文獻探討 中華民國 101年 06月 25日
遺漏值處理 遺漏型態(pattern) 四種遺漏值處理方式 非系統或隨機性遺漏(missing at random) 完全隨機遺漏(missing completely at random, MCAR) 隨機遺漏(missing at random, MAR) 系統性遺漏(systematic missing) 非隨機遺漏(missing not at random, MNAR) 四種遺漏值處理方式 事前預防法 刪除法 虛擬變數法 插補法 中華民國 101年 06月 25日
插補法 熱層插補法(hot deck) 冷層插補法(cold deck) 迴歸插補法(regression imputation) 估計值來自研究樣本自身 冷層插補法(cold deck) 採研究以外的資訊來進行判斷 迴歸插補法(regression imputation) 利用未含遺漏的資料建立迴歸方程式預測估計值 多重插補法(multiple imputation) 理論屬較有系統與完整的 產生多個估計資料集,最終將結果合併產生整體之平均數來填補遺漏值 中華民國 101年 06月 25日
網路成癮量表 網路成癮 中文網路成癮量表(Chinese Internet Addiction Scale, CIAS) 重度網路使用者在網路使用上出現上癮症狀與負面影響 造成強迫性地非自由地使用網路 中文網路成癮量表(Chinese Internet Addiction Scale, CIAS) 陳淑惠等於1998年編寫 2003年再提出修訂版(revision) 量表共有二十六題問項,為李克特式的四點量表 柯志鴻等(2005)的研究也證實此量表具有良好之區辨力 中華民國 101年 06月 25日
研究方法 中華民國 101年 06月 25日
研究流程 中華民國 101年 06月 25日 發放問卷及資料蒐集 412名受測者中,取222筆未含遺漏值資料"完整資料"作為後續研究之用。 電腦模擬產生 一、10%遺漏比率之MCAR遺漏資料。 二、20%遺漏比率之MCAR遺漏資料。 三、30%遺漏比率之MCAR遺漏資料。 四、MAR遺漏資料。 五、MNAR遺漏資料。 利用不同插補法進行遺漏值插補 一、隨機選取插補(RND) 二、問項平均數插補(MEAN) 三、問項中位數插補(MEDIAN) 四、問項眾數插補(MODE) 五、迴歸插補法(REG) 六、多重插補法(MI) (1)比較完全刪除法(LD)、插補法與完整資料的差異 (2)選出較適切之插補方法應用於412筆真實資料並比較使用前後之差異 中華民國 101年 06月 25日
研究設計 問卷發放及回收 遺漏模擬與插補 針對嶺東科技大學一百年度日間部資訊管理學系大學部 模擬MCAR、MAR以及MNAR等三種型態 共發放412份,所蒐集的資料稱為「真實資料」 真實資料中不含遺漏值的「完整資料」共222筆 遺漏模擬與插補 模擬MCAR、MAR以及MNAR等三種型態 每種方法進行1000次的遺漏值模擬與插補 計算偏差(Bais)、標準差(SD)、均方誤差(MSE)以及Kappa值 均方誤差越小代表擁有越大的準確性 Kappa值越高代表兩份樣本越一致 0.61~0.80為強度一致 0.81~1.00為近完美的一致 中華民國 101年 06月 25日
研究選用之方法 完全刪除法(LD) 熱層插補法 迴歸插補法 多重插補法 隨機亂數1~4(RND) 問項平均數(MEAN) 問項中位數(MEDIAN) 問項眾數(MODE) 迴歸插補法 REG-A:遺漏問項作為依變數,以資料編號作為自變數 REG-B:遺漏問項作為依變數,以前一問項作為自變數 多重插補法 MI-A:遺漏問項作為依變數,以資料編號作為自變數 MI-B:遺漏問項作為依變數,以前一問項作為自變數 中華民國 101年 06月 25日
電腦模擬 不同遺漏比率的MCAR資料 遺漏的MAR資料 遺漏的MNAR資料 產生介於0到1的均勻分布 (uniform distribution) 亂數值 x x值小於P值 (P=10%,20%,及30%) 時便將問項的資料值設為遺漏 遺漏的MAR資料 調查發現問項5、18、24部分,男性遺漏情況多於女性 性別為女,10%比率遺漏;性別為男,20%比率遺漏 遺漏的MNAR資料 問項10填答1~2為5%比率遺漏;3~4為20%比率遺漏 其他問項為10%比率遺漏 中華民國 101年 06月 25日
研究結果 中華民國 101年 06月 25日
研究結果 完整資料 平均總分之推估 標準差之推估 誤判百分比與Kappa值 實例應用 222筆完全無遺漏值 平均總分(μ)為57.20。 總分標準差(σ)為12.51。 平均總分之推估 標準差之推估 誤判百分比與Kappa值 實例應用 中華民國 101年 06月 25日
對平均總分之推估於MACR-10%情況 介於0.084~3.330 統計量 LD RND MEAN MEDIAN MODE REG-A REG-B MI-A MI-B Bais 0.145 -0.774 0.002 0.584 0.560 0.003 0.020 -0.697 -0.193 SD 3.327 0.148 0.086 0.335 0.203 0.082 0.121 0.111 3.330 0.788 0.673 0.595 0.084 0.708 0.223 介於0.084~3.330 REG-B(0.084)、REG-A(0.086)及MEAN(0.086)較佳 MI-B(0.223)次之 LD(3.330)為最差 中華民國 101年 06月 25日
對平均總分之推估於MACR-20%情況 介於0.137~1.589 統計量 LD RND MEAN MEDIAN MODE REG-A REG-B MI-A MI-B Bais -1.575 -0.005 1.004 1.098 -0.006 0.045 -1.404 -0.379 SD 0.210 0.141 0.641 0.481 0.130 0.202 0.179 1.589 1.192 1.198 0.137 1.419 0.419 介於0.137~1.589 REG-B(0.137)、REG-A(0.141)及MEAN(0.141)較佳 MI-B(0.419)次之 RND(1.589)為最差 中華民國 101年 06月 25日
對平均總分之推估於MACR-30%情況 介於0.195~2.345 統計量 LD RND MEAN MEDIAN MODE REG-A REG-B MI-A MI-B Bais -2.331 -0.004 1.319 1.450 -0.006 0.089 -2.085 -0.539 SD 0.257 0.181 1.007 0.790 0.182 0.174 0.272 0.237 2.345 1.659 1.652 0.195 2.103 0.588 介於0.195~2.345 MEAN(0.181)、REG-A(0.182)及REG-B(0.195)較佳 MI-B(0.588)次之 RND(2.345)為最差 中華民國 101年 06月 25日
對平均總分之推估於MAR情況 介於0.031~0.269 REG-B(0.031)、REG-A(0.038)及MEAN(0.038)較佳 統計量 LD RND MEAN MEDIAN MODE REG-A REG-B MI-A MI-B Bais 0.003 -0.035 0.001 0.029 0.053 -0.083 -0.041 SD 0.269 0.052 0.038 0.140 0.080 0.031 0.050 0.042 0.063 0.143 0.096 0.097 0.058 介於0.031~0.269 REG-B(0.031)、REG-A(0.038)及MEAN(0.038)較佳 MI-B(0.058)次之 LD(0.269)為最差 中華民國 101年 06月 25日
對平均總分之推估於MNAR情況 介於0.094~3.237 REG-B(0.094)、MEAN(0.103)及REG-A(0.104) 較佳 統計量 LD RND MEAN MEDIAN MODE REG-A REG-B MI-A MI-B Bais 0.465 -0.735 0.045 0.620 0.600 0.046 0.039 -0.650 -0.168 SD 3.203 0.147 0.093 0.340 0.212 0.085 0.124 0.113 3.237 0.750 0.103 0.707 0.636 0.104 0.094 0.662 0.202 介於0.094~3.237 REG-B(0.094)、MEAN(0.103)及REG-A(0.104) 較佳 MI-B(0.202)次之 LD(3.237)為最差 中華民國 101年 06月 25日
對平均總分之推估 LD法最不建議使用 MEAN與REG表現稍較其他的插補法為佳 但在統計上此兩種方法與其他插補法並無顯著性差異 中華民國 101年 06月 25日
對標準差之推估於MACR-10%情況 介於0.598~2.728 MI-B(0.598) 較佳 REG-B(0.671)次之 統計量 LD RND MEAN MEDIAN MODE REG-A REG-B MI-A MI-B Bais 0.295 1.027 1.187 1.134 1.159 1.19 0.665 0.588 SD 2.712 0.167 0.113 0.131 0.123 0.114 0.092 0.112 2.728 1.04 1.192 1.141 1.165 1.195 0.671 0.598 介於0.598~2.728 MI-B(0.598) 較佳 REG-B(0.671)次之 LD(2.728)為最差 中華民國 101年 06月 25日
對標準差之推估於MACR-20%情況 介於1.019~2.388 MI-B(1.019) 較佳 REG-B(1.381)次之 統計量 LD RND MEAN MEDIAN MODE REG-A REG-B MI-A MI-B Bais 2.027 2.378 2.276 2.315 2.384 1.375 2.266 1.008 SD 0.220 0.149 0.177 0.166 0.138 0.178 0.153 2.039 2.383 2.283 2.321 2.388 1.381 2.273 1.019 介於1.019~2.388 MI-B(1.019) 較佳 REG-B(1.381)次之 REG-A(2.388)為最差 中華民國 101年 06月 25日
對標準差之推估於MACR-30%情況 介於1.281~3.587 MI-B(1.281) 較佳 REG-B(2.229)次之 統計量 LD RND MEAN MEDIAN MODE REG-A REG-B MI-A MI-B Bais 2.985 3.575 3.426 3.473 3.582 2.221 3.373 1.264 SD 0.255 0.176 0.206 0.198 0.192 0.204 0.210 2.996 3.580 3.432 3.479 3.587 2.229 3.379 1.281 介於1.281~3.587 MI-B(1.281) 較佳 REG-B(2.229)次之 REG-A(3.587)為最差 中華民國 101年 06月 25日
對標準差之推估於MAR情況 介於0.040~0.298 REG-B(0.040) 較佳 MI-B(0.041)次之 LD(0.298)為最差 統計量 LD RND MEAN MEDIAN MODE REG-A REG-B MI-A MI-B Bais 0.053 0.048 0.054 0.05 0.049 0.034 0.032 SD 0.293 0.037 0.025 0.030 0.027 0.022 0.029 0.026 0.298 0.061 0.059 0.058 0.055 0.060 0.040 0.041 介於0.040~0.298 REG-B(0.040) 較佳 MI-B(0.041)次之 LD(0.298)為最差 中華民國 101年 06月 25日
對標準差之推估於MNAR情況 介於0.024~0.305 REG-B(0.024) 較佳 MI-B(0.027)次之 統計量 LD RND MEAN MEDIAN MODE REG-A REG-B MI-A MI-B Bais 0.174 0.042 0.059 0.046 0.062 0.018 0.058 0.017 SD 0.250 0.032 0.025 0.039 0.026 0.016 0.029 0.021 0.305 0.053 0.064 0.060 0.067 0.024 0.065 0.027 介於0.024~0.305 REG-B(0.024) 較佳 MI-B(0.027)次之 LD(0.305)為最差 中華民國 101年 06月 25日
對標準差之推估 LD法最不建議使用 在MCAR的情況 在MAR及MNAR的情況 MI-B表現稍較其他的插補法為佳,其次為REG-B REG-B及MI-B表現稍較其他的插補法為佳 中華民國 101年 06月 25日
誤判百分比與Kappa值於MCAR-10%情況 插補法 RND MEAN MEDIAN MODE REG-A REG-B MI-A MI-B 誤判百分比 1.9% 2.3% 2.4% 1.6% Kappa值 0.842 0.789 0.769 0.779 0.859 0.833 0.862 誤判百分比介於1.6%~2.4% MI-B(1.6%)和REG-B(1.6%)最佳 MEDIAN(2.4%)為最差 Kappa值介於0.769~0.862 MI-B(0.862)最佳 REG-B(0.859)次之 MEDIAN(0.769)為最差 中華民國 101年 06月 25日
誤判百分比與Kappa值於MCAR-20%情況 插補法 RND MEAN MEDIAN MODE REG-A REG-B MI-A MI-B 誤判百分比 2.6% 3.6% 3.8% 2.5% 2.8% 2.1% Kappa值 0.739 0.590 0.555 0.563 0.588 0.744 0.704 0.792 誤判百分比介於2.1%~3.8% MI-B(2.1%) 最佳 MEDIAN(3.8%)及MODE(3.8%)為最差 Kappa值介於0.555~0.792 MI-B(0.792)最佳 REG-B(0.744)次之 MEDIAN(0.555)為最差 中華民國 101年 06月 25日
誤判百分比與Kappa值於MCAR-30%情況 插補法 RND MEAN MEDIAN MODE REG-A REG-B MI-A MI-B 誤判百分比 3.5% 4.6% 4.8% 3.4% 3.8% 2.6% Kappa值 0.629 0.405 0.365 0.363 0.403 0.614 0.546 0.745 誤判百分比介於2.6%~4.8% MI-B(2.6%) 最佳 MEDIAN(4.8%)及MODE(4.8%)為最差 Kappa值介於0.363~0.745 MI-B(0.745)最佳 RND(0.629)次之 MODE(0.363)為最差 中華民國 101年 06月 25日
誤判百分比與Kappa值於MAR情況 誤判百分比介於0.8%~2.3% Kappa值介於0.980~0.993 REG-B(0.8%) 最佳 插補法 RND MEAN MEDIAN MODE REG-A REG-B MI-A MI-B 誤判百分比 2.0% 2.1% 2.2% 2.3% 0.8% 1.7% 1.3% Kappa值 0.982 0.981 0.980 0.993 0.986 0.988 誤判百分比介於0.8%~2.3% REG-B(0.8%) 最佳 MODE(2.3%)為最差 Kappa值介於0.980~0.993 REG-B(0.993)最佳 MI-B(0.988)次之 MODE(0.980)為最差 中華民國 101年 06月 25日
誤判百分比與Kappa值於MNAR情況 誤判百分比介於1.6%~2.5% Kappa值介於0.759~0.860 插補法 RND MEAN MEDIAN MODE REG-A REG-B MI-A MI-B 誤判百分比 1.9% 2.3% 2.5% 2.4% 1.6% Kappa值 0.838 0.780 0.759 0.773 0.855 0.829 0.860 誤判百分比介於1.6%~2.5% MI-B(1.6%)和REG-B(1.6%)最佳 MEDIAN(2.5%)為最差 Kappa值介於0.759~0.860 MI-B(0.860)最佳 REG-B(0.855)次之 MEDIAN(0.759)為最差 中華民國 101年 06月 25日
研究結果 對平均總分之推估 對標準差之推估 誤判百分比與Kappa值 可直接選用MI-B方法對資料直接進行插補 LD最不建議使用 MEAN與REG表現稍較其他的插補法為佳 統計上此兩種方法與其他插補法並無顯著性差異 對標準差之推估 MI-B與REG-B表現稍較其他的插補法為佳 誤判百分比與Kappa值 MI-B表現最好 REG-B次之 可直接選用MI-B方法對資料直接進行插補 中華民國 101年 06月 25日
實例應用 以MI-B方法應用於真實資料分析 412位回收的問卷中有190份中有遺漏值 (遺漏比率為46%) 方法 程度 完全刪除法(LD) (N=222) 多重插補法(MI-B) (N=412) 低度成癮 167(75.2%) 352(85.4%) 中度成癮 41(18.5%) 46(11.2%) 高度成癮 14(6.3%) 14(3.4%) 完全刪除法(LD) (N=222) 多重插補法(MI-B) (N=412) 平均數 標準差 57.20 12.51 48.12 14.26 中華民國 101年 06月 25日
結論與建議 中華民國 101年 06月 25日
結論 平均總分之推估方面 標準差之推估方面 資料誤判百分比及一致性方面 建議可直接選用MI-B方法對資料直接進行插補 MEAN及REG表現較佳 所有插補法在統計上並無顯著性的差異 標準差之推估方面 MI-B表現較為出色 要求標準差準確的情況下可考慮直接使用MI-B 資料誤判百分比及一致性方面 MAR及MNAR情況 REG-B和MI-B表現較佳 MCAR情況 MI-B始終保有較好的表現 建議可直接選用MI-B方法對資料直接進行插補 中華民國 101年 06月 25日
建議 本研究針對網路成癮量表找出了最適切之插補法 未來可針對以下兩點做更深入的探討 LD方法會造成對中及高度成癮比例的高估 不同量表所適用之插補法各有不同 未來可針對以下兩點做更深入的探討 在標準差的推估上,MCAR遺漏型態中各種插補方法之Bias普遍偏高 建議往後可採取拔靴法(Bootstrapping Method)進行改進 建置為各種量表找出最適切插補方法之使用者資訊系統 LD方法會造成對中及高度成癮比例的高估 本研究建議往後學校進行學生網路成癮的諮商時,可多加強對低成癮族群的輔導 中華民國 101年 06月 25日