2 項目分析.

Slides:



Advertisements
Similar presentations
1.( O ) 在統計學上,大數法則也就是所謂中央 極限定理。 ( 是非題 ) 【 91. 彰師大 測驗與統計】
Advertisements

工職數學 第四冊 第一章 導 數 1 - 1 函數的極限與連續 1 - 2 導數及其基本性質 1 - 3 微分公式 1 - 4 高階導函數.
©2009 陳欣得 統計學 —e1 微積分基本概念 1 第 e 章 微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.
不定積分 不定積分的概念 不定積分的定義 16 不定積分的概念 16.1 不定積分的概念 以下是一些常用的積分公式。
3 受訪者對於本校畢業生各項就業力表現的滿意程度 4 受訪者認為本校畢業生哪些就業力具有優勢.
變數與函數 大綱 : 對應關係 函數 函數值 顧震宇 台灣數位學習科技股份有限公司. 對應關係 蛋餅飯糰土司漢堡咖啡奶茶 25 元 30 元 25 元 35 元 25 元 20 元 顧震宇 老師 台灣數位學習科技股份有限公司 變數與函數 下表是早餐店價格表的一部分: 蛋餅 飯糰 土司 漢堡 咖啡 奶茶.
傳統試題和 IRT試題 分析的方法 國家教育研究院籌備處測評組
單元九:單因子變異數分析.
資料整理與圖表編製 內容說明: 教師與學生互動練習,熟習資料整理 與圖表編製。.
資料整理與圖表編製 內容說明: 教師與學生互動練習,熟習資料整理與圖表編製。.
Interpretation of Test Scores
Lecture 7 試題分析 試題分析的意義 試題分析的目的 試題分析的步驟 試題難度分析 試題鑑別度分析 難度與鑑別度的關係 選項分析.
智力測驗計分與解釋 輔導老師 黃曉樺.
項目分析與信度估計 (Item Analysis and Reliability Estimation )
樞紐分析與資料庫 蕭世斌 Nov 20, 2010.
圓的一般式 內容說明: 由圓的標準式展出圓的一般式.
中二數學 第五章 : 二元一次方程 二元一次方程的圖像.
圓的一般式 內容說明: 由圓的標準式展出圓的一般式.
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
數 據 分 析 林煜家 魏韶寬 陳思羽 邱振源.
17 類別資料的分析  學習目的.
物價膨脹與通貨緊縮 物價膨脹.
第四章 數列與級數 4-1 等差數列與級數 4-2 等比數列與級數 4-3 無窮等比級數 下一頁 總目錄.
5.1 自然對數函數:微分 5.2 自然對數函數:積分 5.3 反函數 5.4 指數函數:微分與積分 5.5 一般底數的指數函數和應用 5.6 反三角函數:微分 5.7 反三角函數:積分 5.8 雙曲函數.
第五章 標準分數與常態分配 第一節 相對地位量數 第二節 常態分配 第三節 偏態與峰度 第四節 常態化標準分數 第五節 電腦習作.
實驗計畫資料分析作業解答 何正斌 國立屏東科技大學工業管理系.
第四章 資金成本.
邏輯迴歸 Logistic Regression
Wavelet transform 指導教授:鄭仁亮 學生:曹雅婷.
第十一章 相關研究法.
指導老師: 蘇明俊 老師 組長:潘翠娥 組員:張惠雅 葉麗華
Ch2多項式函數 2-2 多項式的運算與應用 影音錄製:陳清海老師 資料提供:龍騰文化事業股份有限公司.
第一章 直角坐標系 1-3 函數圖形.
四年級 數學科.
小學數學科 二年級課程 — 統計圖 製作 — 麥頌儀老師 (青山天主教小學上午校).
第十章補充 允收抽樣.
突破機構 青少年使用ICQ 行為調查.
數學 近似值 有效數值.
網頁資料知多少? 事 實 ? 謠言?.
基礎數學概念評量 柯華葳 編製.
Definition of Trace Function
有關於股票報酬及匯率變化對台灣醫療產業市場收益的分析
信度分析 (11/7~11/13) 1.何謂『信度』 2.信度分析步驟.
臨床生理復健相關適性化評估測驗 組員: 翁嘉遜、陳雅苹、吳蕙雯、 陳愉婷、管玉芬、許全.
楊志強博士 國立台北師範學院 測驗品質考驗與TestGraf 98的應用 楊志強博士 國立台北師範學院
Measurement in Research
報告人: 范誠達 指導老師:任維廉 教授 日期:2010/5/4
小數除法.
第五章 估計與信賴區間 5.1 估計概論 估計量的分配 信賴度、信賴區間與最大容忍誤差16
第十章 證券投資組合.
Live ABC 英檢網使用說明 - 1 登入帳號:學號 登入密碼:學號 (第一次登入請更改密碼).
小學數學科 方塊圖 製作 — 麥頌儀老師 (青山天主教小學上午校).
Development of the Standardized Tests
MiRanda Java Interface v1.0的使用方法
教育概論 教育原理與制度試題解題與分享 第五組
試題分析.
二項分配-Binomial 伯努利試驗(Bernoulli Trial) 每一次試驗皆僅有兩種可能結果,不是成功(S),就是失敗(F)。
第十四章名義資料的數字 描述:關連測量 © Copyright 版權所有:學富文化事業有限公司。本光碟內容僅提供教師於教學上使用,非經本公司許可,禁止複製 (給學生)。感謝老師的配合。
※歡迎挑戰,兩人(隊)中先完成連線即算過關!
例題 1. 多項式的排列 1-2 多項式及其加減法 將多項式 按下列方式排列: (1) 降冪排列:______________________ (2) 升冪排列:______________________ 排列 降冪:次數由高至低 升冪;次數由低至高.
1-1 二元一次式運算.
10328: Coin Toss ★★★☆☆ 題組:Problem Set Archive with Online Judge
13194: DPA Number II ★★☆☆☆ 題組:Problem Set Archive with Online Judge
( )下列何者正確? (A) 7< <8 (B) 72< <82 (C) 7< <8 (D) 72< <82 C 答 錯 對.
第十四章:工作抽查 工作抽查:係在隨機時間進行大量觀測以分析工作的方法;其結果可用來有效訂定各操作的適當寬放、衡量機器和人員的操作情形及建立生產的標準時間;其數據的準確性,視觀測次數及隨機觀測所涵蓋的期間而定。 工作抽查的優點:p524。 工作抽查的理論:係依據機率的基本法則;公式如p 及例題14-1。。
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
10303: How Many Trees? ★★☆☆☆ 題組:Contest Archive with Online Judge
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
第三章 比與比例式 3-1 比例式 3-2 連比例 3-3 正比與反比.
Presentation transcript:

2 項目分析

項目分析 主要目的: 一份測驗的題目內容是否真正測到想要測量的行為特質.

項目分析又稱為題目分析,項目分析可以提升測驗題目的品質,進而提高測驗的信度與效度 項目分析可以依據題目的內容與形式做質性分析,也可以根據題目的統計資料做量的分析

質性分析包括內容效度的評量,以及撰寫題目過程的評量 量的分析包括項目難度與鑑別力的分析 項目分析可提高測驗的信度與效度外,在教育測驗上可以利用它來選擇優良的題目,建立考試題庫

第一節 質的項目分析(朱,P20-23) 一份良好測驗的品質至少需要兩類專家的合作 1.熟悉主題內容的專家(主題內容理論) 2.熟悉測驗編制的專家(測驗技術) 具備有教育及心理計量背景的專業人員 (教育, 統計, 信度,效度,常模..) 幫助釐清整體的測驗結構, 並指導題目敘 述的問題( 命題結構技巧,誘答力或題目敘 述技巧)

2.1.1 內容主題專家 主題內容專家可以透過問卷,調查, 訪談或討論的方式來凝聚共識 =>會出現的現象, 同樣主題不同編制者, 可能出現不同測驗風貌或向度

Q: 除了以上所提, 誰還可以是測驗主題的專家?

題目內容敘述注意事項 同學嘗試-題目內容敘述注意 王慶福-成人依附風格量表 https://nscnt12.nsc.gov.tw/APPLYFORM/WRITINGS/M100179681/1997.pdf 2.1.2 題目內容敘述 避免否定的敘述( 反向敘述,過去….現在…) 避免雙否定的敘述 注意頻率副詞的使用(特別是李克特式量表) 避免負向情緒的字眼 避免模稜兩可的語句

第二節 量的項目分析 在檢驗個題目的鑑別力,難易度,作為刪題的標準,對於日後效度檢驗有幫助( 可以正確辨識受試者能力高低或行為特質強弱的程度) 2.2.1 項目難易度 2.2.2 項目鑑別度

2.2.1 項目(題目)難易度 測驗題目難易度的分析,通常以全體受測者答對某試題的人數百分比來表示,這個百分比又稱難度指數,其計算公式如下: R P= × 100% N 式中: P代表項目的難度指數;N為全體受測者人數;R為答對的人數 例如: 在100名預試的學生中,有60人答對第3題,則該題的難度指數為60%

2.2.1 項目難易度 指針對某一試題, 其施測取樣中答對人數的百分比 P=1(太容易) P=0(太難) P=.5( 適中) *討論量尺與難度的關係可以參考葉永新 (C5-第一節全部)

測驗題目的設計與分配 1.由易而難 2.題目應該呈常態分配(哪類題目應該要多?那些要少?) –要依測驗目的而定

肆 測驗分數的分析 就整個測驗的難度來說,它與各個項目的難易度有直接關係,整個測驗的難度,可以由全部測驗分數的分布而得知 肆 測驗分數的分析 就整個測驗的難度來說,它與各個項目的難易度有直接關係,整個測驗的難度,可以由全部測驗分數的分布而得知 一般而言,在一個標準化的樣本中,其測驗分數呈現常態分布曲線。但有一些樣本的測驗分數成偏態,如圖5-3所示

在該圖A部分與B部分均屬於偏態,前者分數集中在左端,也就是分數偏低,測驗題目較難,後者就正好相反 測驗項目太困難或太簡單,都不適於測量受測者之間的個別差異

左偏,正偏 圖5-3 偏態分佈曲線 右偏,負偏

伍 項目難度與測驗題目的關聯 標準化心理或教育測驗的設計,通常設法將所有受測者的能力作最大的區別 伍 項目難度與測驗題目的關聯 標準化心理或教育測驗的設計,通常設法將所有受測者的能力作最大的區別 在編製測驗題目時,有時要根據測驗的目的來規劃題目的難度

2. 2. 2 項目鑑別度影響效度 指某個題目能夠正確分辨受試者能力,或所測行為特質的表現的強弱程度 2.2.2 項目鑑別度影響效度 指某個題目能夠正確分辨受試者能力,或所測行為特質的表現的強弱程度. 項目鑑別度目的—作為刪題標準 將沒有鑑別度, 鑑別度不佳,或鑑別相反(P24-的題目予以刪除,而留下有鑑別的題目,進而該測驗才會有效度

鑑別相反 能力好的傾向於答錯,能力差的卻達對

第三節 認知能力測驗 2.3.1 題目類型:認知能力測驗為顧及標準化過程,多以選擇題方式進行( 年齡V.S.選項數目; 不同的測驗類別可以測量不同的認知能力) 2.3.2 小樣本極端組鑑別度分析 極端組的分法: 小樣本, 高同質性; 常為兩組或三組(條件有三P26) 難易度、鑑別度分析 難易度與鑑別度的關係 刪題標準

第三節 認知能力測驗 2.3.3 點二系列相關分析 2.3.4 誘答力分析

難易度、鑑別度計算分析

小樣本極端組鑑別度分析p25 項目分析以答對某一個題目的人數比率,與效標組的人數比率加以比較 當效標以連續量表來測量時,例如:學業成績、工作成績,或在測驗上的總分,從分數分布中選出高與低效標組,就是極端分數組

肆 小樣本的簡單分析 項目分析有時可以利用小樣本來實施 例如: 一個班60名學生接受考試,測驗結果進行題目分析可以採用以下簡便方法

先選出高、低分組學生各20名,其餘20名學生為中間組,然後計算這三組學生在各個題目上答對的人數百分比 假設以U代表高分組,M代表中間組,L代表低分組,將這三組學生答對的人數統計出來,結果假設如表5-2所示

表5-2 項目難度與鑑別值

由該表可知,各題鑑別值為高分組(H)減去低分組(L),各個項目的難度則為高、中、低三組答對學生人數的總和,也就是H+M+L 鑑別值愈大,表示此項目愈具有鑑別度

在教師自編的學科測驗中,實施題目分析的主要目的,在確定測驗題目命題的優劣,不適宜的題目應予淘汰 選擇題通常要對每一個選項進一步分析,以了解各選項的良劣—誘答力分析 茲以表5-3的資料說明之

表5-3 個別項目反應的分析

伍 鑑別指數 在前述高分組與低分組受測者中,將每一題答對人數改用百分比來表示,則其百分比的差異就是項目鑑別指數,其計算公式如下: 伍 鑑別指數 在前述高分組與低分組受測者中,將每一題答對人數改用百分比來表示,則其百分比的差異就是項目鑑別指數,其計算公式如下: D=PH-PL

式中: D代表鑑別指數 PH為高分組答對項目人數百分比 PL為低分組答對項目人數百分比 例如: 高分組答對某試題的人占75%,低分組答對該題的人占20%,則其鑑別指數(D)為:.75-.20=.50

鑑別指數愈大,表示受測者對個別試題反應與總分的一致性愈高 以表5-2資料來說明(呈現結果如表5-4)

表5-4 以表5-2資料計算鑑別指數

將表5-2每一題高分組與低分組答對人數轉換為百分比,因為這兩組都有20人,因此可將表中的數字除以20然後乘上100,就可得到答對的人數百分比 例如: 第一題高分組有12人答對,其答對人數百分比為12÷20×100=60

另外一種計算方法是先將100除以20,得到5,再將5乘上表內的數字,就可以得到答對的人數百分比 例如: 表5-2第2題高分組有20人答對,其答對的人數百分比為20×5=100

表5-5 項目難度與最大鑑別值的關係

由表5-5可知,難度適中的項目,其可能的鑑別值比較大 當測驗題目難度等於 .00或1.00時,其鑑別指數最小;當難度等於 .50時,其鑑別指數最大 項目難易適中時,具有最大的鑑別力 有難易度不等於有鑑別力

不呈常態,反而不佳

刪題標準P30 教師自編成就測驗—P值盡量是.7-.9 心理測驗---------------P值盡量是.5 *都要刪去d<0的題目 針對一般成就測驗(校標參照測驗),有些甚至將d<.2 的題目都刪去(但要注意刪題標準--閱讀書本, P31,最後一段, 以免出現像圖2.1的情形)

點二系列相關分析P32 r 愈接近1愈好 二分變項(指題目答案)與連續變項(指總分)求相關—用點二系列相關方法 ), 可使用點二系列相關分析(r pb),此值可以表示題目鑑別度 r 愈接近1愈好 其刪題標準 r<.1 或 r<.05

二系列相關的計算,涉及答對與答錯題目的平均效標分數、全部效標團體的標準差,與答對及答錯題目的人數比率 rbis的計算公式如下:

式中: :答對某一測驗題X目之受測者,測驗 總分數的平均數 :所有受測者,不論答對或答錯該測驗 題目總分之平均數 :所有受測者測驗總分的標準差

P:答對之人數百分比 Y:答對人數百分比時,常態分配曲線的 高度 rbis:標準誤差以及二系列相關的計算,都 可以直接使用電腦統計套裝軟體來運算, 以節省時間

2.3.4誘答力分析P34 (閱讀課本)

第四節李克式量表P35-42

第四節 李克式量表 2.4.1 鑑別度分析p35 2.4.2 社會期許分析 2.4.3 一致性分析 t 檢定 效標題 Alpha係數 第四節 李克式量表 2.4.1 鑑別度分析p35 t 檢定 效標題 2.4.2 社會期許分析 2.4.3 一致性分析 Alpha係數 因素分析

第五節 其他測驗 2.5.1 適性測驗 項目反應理論分析

項目反應理論 在1970年代末期,有一些心理測驗學者致力於測驗項目難度的探討,由於這方面的研究需要複雜的計算過程,因此通常是以電腦來幫助運算 這些研究是以潛在特質模式為基礎的

潛在特質是個人潛在的能力,它可以經由觀察個人對測驗題目反應之間的關係,並透過數學的處理而獲得 由受測者在測驗上所獲得的總分,來初步估計其潛在特質。有些學者以項目反應理論(簡稱 IRT)來替代它

項目反應理論是針對電腦化適性測驗(簡稱CAT)發展出來的測驗理論 適性測驗是電腦根據受測者的能力,快速運算與選題的功能,給受測者不同鑑別度的題目

補充朱P46 最早應用於電腦化適性測驗的項目分析. 由於電腦化適性測驗的智慧型答題過程設計較複雜的選擇(即能力評估),因此要對每一個題目的各方面特質掌握更清楚.其項目分析必須使用特殊的測驗軟體才能完成 一般傳統測驗不建議用IRT方式作項目分析, 因為那將使項目分析過於複雜.

IRT的項目分析結果會呈現各題的 P值, 點二系列相關係數, ICC曲線(項目特徵曲線,item characteristic curve) ICC曲線代表的是鑑別度,當曲線是由左下向右上, 鑑別度為正, 斜率愈接近1,鑑別度愈好;當斜率是0 ,曲線會呈垂直線或是水平 當曲線是呈左上,向右下,斜率是負值,也就是鑑別相反的意思( 低分組答對高於高分組) 題目要刪掉

拿朱錦鳳pptp46-47

在估計個人特質時,應摒除測驗特性的影響,將題目難度與特質分數轉化成相同的量尺,對測驗結果的解釋與預測,有很大的幫助 項目反應理論已被大規模的測驗計畫所採用,為提高估計特質的精確性,可利用電腦程式來估計受測者的潛在特質

項目難度與項目鑑別度,可以利用項目測驗迴歸圖來表示 茲假設一個測驗有12個簡答題 表5-6表示這12題總分中,第5題與第11題此兩題正確作答的人數百分比,並將這些資料繪成圖5-4

表5-6 項目測驗迴歸之假設性資料

圖5-4 項目測驗迴歸曲線 曲線的斜率表示該題的鑑別度 左右位置表示該題的難易度 易 難

圖5-5 三個項目的特徵曲線

項目特徵曲線(簡稱ICC)的三個參數模式中,每個模式都是由實證資料衍生出來 題目辨別參數(ai)表示曲線的斜率,斜率值愈大,則曲線愈陡峭

圖5-5中: 題目1和2的斜率相同,其辨別值也相同 題目3的斜率較小,其曲線比較平坦 題目難度參數(bi)在橫軸上正確反應機率為 .50

項目特徵曲線愈趨近於右邊,表示這個項目愈難;愈靠近左邊,表示項目愈簡單 由ICC曲線的位置就可看出題目的難易度 題目2和題目3之(含b2、b3)相同,而題目1較簡單,它需要較少的能力就能有50%的正確反應機率

IRT模式在處理多重選擇項目時,常包括第三個參數,就是所謂猜測參數(Ci),它代表做正確反應時,猜測所占的比率 在多重選擇的項目中,即使受測者的能力很低,做正確反應的機率也高於零,這種現象可以由該圖中第三個項目的曲線得知 ( 較難, 斜率低-鑑別度低, 但還是有猜對可能性)

項目分析-IRT分析— 要檢視曲線的斜率(角度): 左下往右上 曲線位置的分配密度(呈常態分配最好) 刪題的標準p47,當ICC曲線是…(不符合以上兩個條件)

可不看 題目參數與能力兩者的估計方法,通常以連續接近程序來計算,使其一直重複到該值穩定為止 項目反應理論尚有幾個優點: 經由項目資訊方程式來處理測量的信度與誤差 這些函數可由每個題目計算,對於測驗題目的選擇提供良好的基礎

參 項目反應理論模式的優缺點 項目反應理論最主要的貢獻,就是測驗結果不受樣本特性的影響,這又稱為題目參數的不變異量 參 項目反應理論模式的優缺點 項目反應理論最主要的貢獻,就是測驗結果不受樣本特性的影響,這又稱為題目參數的不變異量 項目反應理論的基本概念,是項目參數在計算不同能力受測者團體樣本時保持不變

2.5.2 速度測驗P47 測速度的測驗,題目通常都是很容易的,所以無所謂鑑別力之分,通常不需要做難度與鑑別力分析

第六節 取樣及刪題比例 2.6.1 效度縮水P48 (閱讀課本) 項目分析的取樣要考慮 1.取樣數量,不要少於50 第六節 取樣及刪題比例 2.6.1 效度縮水P48 (閱讀課本) 項目分析的取樣要考慮 1.取樣數量,不要少於50 2.刪題不要多於原題數的1/3,否則都會造成效度縮水 影響效度縮水通常有三個原因

編制測驗三次取樣過程(SAMPLE都需不同)—進行交叉效度 2.6.2 交叉效度- 運用不同的取樣來驗證題目測驗效度的準確性—是進行項目分析及效度測驗的過程 項目分析要進行第一次取樣(判斷每一個題目是否有效,: 刪掉無效題,保留有效題) 之後,進行第二次取樣,進行測驗信效度分析 第三次取樣,建立常模

第七節 項目誤差- 項目誤差定義: 測驗的任一個題目 因為不同的族群而產生不同的鑑別度或難易度的情況 若有此情形,會考慮刪題 項目誤差是測驗誤差的來源,影響測驗效度

第七節 項目誤差 明顯的,通過第I題的B群人數遠多於A群人數

思考題目 試述測驗經項目分析後所得到較少題數的新測驗,為何反而比較有效。 討論項目難易度及項目鑑別度的關聯性。 討論題目平均難易度對測驗的重要性。 試述項目難易度和錄取率的關係。 試述次數分析在項目分析的用意。 試述教師自編測驗適用的項目分析方法。 試述t測驗在項目分析的用意。

思考題目(續) 試述Coefficient α在項目分析的用意。 試述項目分析的目的。 試比較Phi r、Point-Biserial r、Pearson r的差異。 試述IRT與其他項目分析方法的差異。 討論速度測驗的項目分析。 試述Cross Validation如何驗證及其重要性。 討論Differential Item Functioning的概念。