High-stake OSCE 考官核心課程

Slides:



Advertisements
Similar presentations
公平有效的測量 師資培育中心 陳承德 2016/1/21. 測量與評量 本講重點 ◦ 潛在特質 - 單一、瞭解結構 ◦ 被測量者 - 標準化 ◦ 測量者 - 客觀、一致性 ◦ 測量工具 - 行為樣本、有效性 被測量 者 測量者 特質 測量工 具.
Advertisements

臨床能力評估測驗:OSCE 方信元Hsin-Yuan FANG MD PhD 中國醫藥大學附設醫院教學部副部主任
電腦軟體應用技能檢定 考照說明.
海洋教育:教科書、教師與教學 第七至十章導讀 宏仁國中 林珮瑜
105年牙醫師畢業後一般醫學 師資培育-選修課程 教學課程設計與評估方法
Lecture 7 試題分析 試題分析的意義 試題分析的目的 試題分析的步驟 試題難度分析 試題鑑別度分析 難度與鑑別度的關係 選項分析.
这辈子只做一件家务,你会做什么? A、拖地 B、洗碗 C、做饭 D、倒垃圾.
《传播统计学》 作者:柯惠新 祝建华 孙江华.
5A 陳幸瑜(1) 朱栢霖(9) 林彩兒(16) 岑樂謙(22) 温頌嫻(28) 溫鎔而(29)
張瓊云藥師 台中榮民總醫院 藥劑部 Mini-CEX運用之經驗分享 中 榮 張瓊云藥師 台中榮民總醫院 藥劑部.
人員招募與甄選 林佩儀 林彥伶 曾雪玲 古竺豔.
尊重价值规律.
104 學年度第二學期 高中多元選修課程說明會 Calculus(I) 開課教師:老師 開課教師: Mr. Math 老師2016/02/15.
西南财经大学实验经济学短期课程“实验的设计和具体操作”专题讲座
High-stake OSCE 考官核心課程 SP在高階OSCE的角色與常見問題
臨床教師培育研習營分享 門診護理科 梁素綺.
應用統計學 授課大綱 – 暑期班 By: Dr. Tsung-Nan Tsai.
第7章 量表的建立—補充 4.1 基本觀念 4.2 測量程序 4.3 測量尺度 4.4 良好測量工具的特性 4.5 信度測量
多變量分析 Multivariant Analysis
单元目标: ▲初步了解我国素质教育的由来 ▲全面把握素质教育的基本理念 ▲正确认识我国中小学素质教育实践中涌现的个案经验
研 究 方 法 徐南麗教授 元培醫事科技大學 護理系.
社会医学研究方法.
學習共同體實施心得分享 新泰國中 報告者 張國振校長.
心理学研究方法 Research Methodology of Psychology 段锦云 苏州大学应用心理学研究所
TQC+ JAVA全國教師研習會 PLWeb 程式設計練習平台 簡介.
第十三章 調查研究.
量化與質化的測量 組員:                   .
第8章 態度的衡量與信度、效度的檢定 本章的學習主題 1.衡量的意義 2.衡量的尺度 3.衡量的指標 4.衡量尺度與統計分析 5.態度的意義 6.態度的衡量尺度 7.信度與效度的意義 8.衡量的誤差來源 9.信度與效度與其他相關因素的關係.
REGRESSION FOR ORDINAL OUTCOMES 「順序尺度依變項」的迴歸模型
第8章 衡量方法及信度與效度的檢定  本章的學習主題  1.衡量的意義 2.衡量的尺度 3.衡量的指標 4.衡量尺度與統計分析
Marketing Research and Analysis
CHT IPv6測試 D-Link Taiwan 友訊科技台灣分公司 TTSS 電信技術支援課 Name:
员工的招募、甄选和录用 东北林业大学经济管理学院 田昕加
5 甄選 國立中山大學企管系 甄選.
臨床教學回饋技巧 與能力評估 長庚紀念醫院 急診醫學科.
指導老師: 蘇明俊 老師 組長:潘翠娥 組員:張惠雅 葉麗華
網路安全技術 OSI七層 學生:A 郭瀝婷 指導教授:梁明章.
第二版 © Copyright 版權所有:學富文化事業有限公司。本光碟內容僅提供教師於教學上使用,非經本公司許可,禁止複製 (給學生)。感謝老師的配合。
VIDEO COMPRESSION & MPEG
為成功制定目標和行動計畫 國際獅子會分區主席訓練.
第十章補充 允收抽樣.
網頁資料知多少? 事 實 ? 謠言?.
哪些人是管理者? 管理者? 指和一群人工作,並藉由協調他人來完成工作,以便達成組織目標的人
Definition of Trace Function
信度分析 (11/7~11/13) 1.何謂『信度』 2.信度分析步驟.
臨床生理復健相關適性化評估測驗 組員: 翁嘉遜、陳雅苹、吳蕙雯、 陳愉婷、管玉芬、許全.
Measurement in Research
報告人: 范誠達 指導老師:任維廉 教授 日期:2010/5/4
健體領域差異化教學策略 簡報來源:教育部健體輔導群中央團
兒少保護通報處理流程介紹 臺中市家庭暴力及性侵害防治中心 陳秀婷/張美慧 社工督導員 2012/10/19.
績效考核 一.績效考核: 1.意義 2.目的 3.影響績效的因素 二.要考核什麼? 三.誰來負責考核? 四.運用什麼工具與方法?
The viewpoint (culture) [观点(文化)]
NASA 二階.
嘉義市崇文國小 製作者:林雅惠、張英燦、曾瑞媛 日期:
Development of the Standardized Tests
MiRanda Java Interface v1.0的使用方法
教育概論 教育原理與制度試題解題與分享 第五組
第18章 人力資源管理 人力資源管理概論 人力資源管理活動的層次 現代的選才策略 員工任用管理與激發員工潛能 員工訓練發展計畫
黃影雯副教授講授 E_Mail Address:
108.
PVQC-校內賽 考生注意事項.
Chapter 13 測量之信度與效度分析. Chapter 13 測量之信度與效度分析 潛在變數與衡量變數的關係 在理論模型中的變數,通常很難直接衡量,我們稱為潛在變數(latent variables) 我們必須找尋或設計出足以代表這些潛在變數的衡量指標,而這些指標則稱為衡量變數(measurement.
第一節 績效考核週期 第二節 考核系統績效標準 第三節 績效考核的效標 第四節 績效考核的原理與原則 結 語
8 員工績效評估與績效管理. 8 員工績效評估與績效管理 績效管理的主要目的 理想的績效評估指標應該具備的特性 如何運用各種績效評估的方法 可能的績效評估資訊來源及360度回饋系統 績效評估過程可能發生的偏誤 如何成功的進行回饋面談 人力資源管理:基礎與應用 ch8 員工績效評估與績效管理.
備審資料準備要領 許書銘 東海大學 企管系主任.
Speaker : YI-CHENG HUNG
超我服務 Service Above Self
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
有趣的計算 如果令A、B、C、D……X、Y、Z這26個英文 字母,分别等於百分之1、2、3、4……24、
CHT IPv6測試 D-Link Taiwan 友訊科技台灣分公司 TTSS 電信技術支援課 Name:
Presentation transcript:

High-stake OSCE 考官核心課程

OSCE 評分 標準化病人 考官 考題 評估表

OSCE 評分 信度 (reliability, repeatability, reproducibility) the ability to perform its functions consistently 效度 (validity) the tool measures what it claims to measure

信度 信度是指可靠性或一致性 信度好的指標在同樣或類似的條件下重複操作,可以得到一致或穩定的結果。 通常用測試與再測試方法(test-retest method)來檢視一個指標的穩定信度,也就是將同樣的指標對同一群體重新施測,如果每次都得到同樣的結果,則此指標即有穩定信度。

效度 指概念定義(conceptual definition)及操作化定義(operational definition)間是否契合。 測量的效度比信度難達到。因為構念是抽象的,而指標則是具體的觀察。我們對於一個測量是否有效度並無絕對的信心,但可判斷是否比另一測量更有效度。

如何增進信度 明確的概念化 提升測量尺度的精確性 使用多重指標 使用預試(pretests)、前導研究(pilot studies)及重複測試(replication)

‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ OSCE 評分 信度 (reliability, repeatability, reproducibility) 效度 (validity) ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧

OSCE 評分 標準化病人 validity reliability 個案 validity 評估表 validity

考官訓練 Intra-rater Reliability 同一評分者在重覆多次的評分時機下能夠有一 致的評分水準 同一評分者在重覆多次的評分時機下能夠有一 致的評分水準 Inter-rater Reliability 不同的評分者能夠認同公告所規定的評等標準 不同的評分者能夠同意彼此的評分 不同的評分者對於怎樣的表現算是好、怎樣的 表現算是不好有共識

考官訓練 寬鬆效應 (leniency effect, Kneeland 1929): rating the positive more positive 嚴苛效應 (severity effect, Ford 1931): rating the negative more negative 月暈效應 (halo effect): rating of a trait influences the rating of another trait 隨機效應 (randomness effect): 評分者沒有背景知識或訓練不足,以致於無法對量尺作出適當的區別,因而採用一種隨意的方式來對受試者進行評估。 http://www.bctest.ntnu.edu.tw/flying/flying41-50/flying43-5.htm

寬鬆效應& 嚴苛效應 寬鬆效果係指評分者無論在何種情況下,有評高分的傾向; 嚴苛效果就是評分者無論在何種情況下,皆有評低分的傾向。

月暈效應 (halo effect) 一個人表現好時,大家對他的評價遠遠高於他實際的表現 反之,一個人表現不好的時候,別人眼中所認為的差勁程度,也會遠大於他真正差勁的表現。 當評分者對某人某特質的評斷,是依據其對此人整體印象的優劣而定時,就有月暈效果。

考官訓練 中央趨勢 (central tendency): 當評分者避免使用極端類別,而將評分集中於量尺的中間時,會使得評分較缺乏鑑別力,進而導致信、效度的降低。 侷限效應 (restriction-of-range effect): 但中央趨勢專指評分集中於評分量尺中點附近;在侷限效果中,評分可集中於評分量尺中的任何一點 邏輯誤謬 (logical error): 評分者相信某兩特質間有所關連,而給此兩特質相似或不相似之評等時,即有所謂之邏輯誤謬。 http://www.bctest.ntnu.edu.tw/flying/flying41-50/flying43-5.htm

考官訓練 投射效果 (contrast error): 評分者傾向以自己與受試者作比較,但針對某種自己具有的特質,給予受試者和自己的評等卻完全不同。 次序效果 (order effect): 受試者的受評次序會影響其所得的評等環境、評分者與受試者背景因素影響: http://www.bctest.ntnu.edu.tw/flying/flying41-50/flying43-5.htm

考官訓練 那部份因素影響最大? 評量者心態 (Downing SM, Medical Education, 2005) 怎樣提升OSCE的評量者評量結果之客觀性? 訓練  基本假設…

考官訓練 你為什麼要受訓? 大環境因素 受訓者自我定位與角色 受訓者內在與外在因素 (鞭子與胡蘿蔔)

考官訓練 說明會 影音演練 Discussion group Modified Delphi-Method

考官訓練 體能訓練? 考試執行: 全國採共同考題,每題測驗8分鐘。 每日三場次,每場次考12人,每考場每日測驗 36人。 自我承諾書 (Wilkinson, 2003)

提升客觀性 Direct Observation of Competence Training (Muller,1998; Holmboe, 2004; Angkaw, 2006) Performance dimension training Frame-of-reference training Behavioral observation training

評分表發展流程 Performance dimension training 臨床能力 確認評估目標 逐項目進行討論決定去留 定義測量面向 醫療面談 臨床判斷 專業素養 身體檢查 Performance dimension training 決定評分方式checklist(有/無) 或是 Likert scale(1~5) 溝通技巧 同理心 確認訴求 共同決策 … 每一面向拆解成數項欲測量項目 逐項目進行討論決定去留

Frame-of-reference training 決定評分方式checklist(有/無) 或是 Likert scale(1~5) 例 評分表發展流程 確認評估目標 Mini-CEX Frame-of-reference training 定義測量面向 醫療面談 臨床判斷 專業素養 身體檢查 決定評分方式checklist(有/無) 或是 Likert scale(1~5) 溝 通 技 巧 同理心 確認訴求 共同決策 OSCE / Scenario management 每一面向拆解成數項欲測量項目 眼神接觸 開放式問句 逐項目進行討論決定去留 不打斷病人談話 未使用專有名詞

Behavioral observation training Role-play : Best VS. Worst

提升客觀性 Differential rater function over time (DRIFT) (Mclaughlin, 2009; Wolfe, 2001; Klein, 2003; Hopkins, 1998.) Rater fatigue 題目難與易? 15-20分鐘熱身 (warming-up) 可提升sensorimotor & cognitive performance?

提升客觀性 籌備會議配題藍圖 核心工作小組 考題編修 (文字) 考題信效度測試 SP演出效度測試 師資群訓練 評分共識培訓 專家指導 考題信效度測試 籌備會議配題藍圖 SP演出效度測試 核心工作小組 師資群訓練 評分共識培訓 師資群訓練 評分共識培訓 網路評分共識培訓 (出題、測試、評分考官) 網路影音平台 得菲法評分共識建立

總結 考官「薦」、「派」 試場規則與保密 reliability 自我承諾書 (Wilkinson, 2003)

High-stake OSCE 考官核心課程 OSCE評分表與及格標準之制定原則

何謂標準設定? 標準設定是一套合理的程序及準則,藉以產生一個分數,用以分辨出兩組應試者,或者是兩組不同程度的能力 此標準要能服人(defensible) 產生一個決斷分數(cut-score)、門檻、通過分數 譚克平教授提供

標準設定的目的 定出每一站的及格分數 系統性的方法 能取信於人 能經得起質疑 證據為依據 28

評分系統建議 評分項目10-15項 採用評分尺標 0 , 1 , 2。 最後有整體評分 1 ~ 5 分。 29

評分標準建議 評分表評分項目逐項說明 Criterion-based design(同2011) Modified Delphi-method rater training Rating practice by Video + Real-time discussion forum on internet 30 30

及格標準設定 實作評量之標準設定方法,大致可以歸納成三大類(Berk, 1984, 1986; Hambleton, 1990; Hambleton & Zaal, 1991): 1. judgmental methods Nedelsky method Ebel method Angoff method 2. Empirical methods Livingston method Linden & Mellenbergh method 3. Combination methods Borderline-group method Contrasting-group method 31 31

OSCE及格標準設定建議 Borderline group method + regression(2011年採用) 計算方法 Step 1. 令Y:考生的checklist總分 X:考生的global rating總分 Y=aX+b 求出每一站 a, b Step2. 以X=2.5帶入,得到每一站的及格分數, 並得出不及格站數之考生 Step3. 將各站及格分數加總, 得十二站總分之及格分數 32

Example from Boursicot(2003) y=ax+b 譚克平教授 33 33 33 33 33

OSCE及格標準設定建議 Angoff method(考試前訂定及格標準) 執行方法 請專家就每一個試題中,最低能力考生所可能答對之機率,進行評定。 將每題可能答對之機率加總,便成為該專家所判斷的通過標準。 再將數位專家之判斷的通過標準加以平均,便成為該測驗之最後的通過標準。 ■出題時同時訂定及格標準。 36

Angoff方法 􀁺1971 􀁺popular 􀁺很多變種 􀁺Modified Angoff 􀁺Extended Angoff 􀁺Yes/No 譚克平教授提供

Angoff方法 學科專家 開始時,評審團在會議中對所有題目做判斷 想像minimally competent examinee的學生 如有需要可彼此討論 需發揮想像力 答對的機率 很多標準設定專家小組有10-15人 譚克平教授提供

修正的Angoff流程 目前並未有一致的定義 Reckase(2000)曾提出分為下述五個步驟進行: 1. 選擇設定標準的人員; 2. 訓練設定者。 3. 要求設定者定義並描述受試者應當達到的表現 水準。 4. 令設定者估計(最低能力)受試者在每個試題 上的表現。 5. 引導設定者檢視實徵資料,如:試題的難度水 準(P值)。

Angoff方法 譚克平教授提供

Angoff方法 譚克平教授提供

瞭解評分表項目 勾選 ←

考官注意事項 評分時: 評分表填寫。 整體表現評直覺勾選一項。

考官注意事項 考試結束後: 每一考生結束時請確認評分表每一欄位皆已完成評分。 待工作人員清點、確認後,始得離開考場。