High-stake OSCE 考官核心課程

Slides:

Advertisements

Similar presentations

公平有效的測量師資培育中心陳承德 2016/1/21. 測量與評量本講重點 ◦ 潛在特質 - 單一、瞭解結構 ◦ 被測量者 - 標準化 ◦ 測量者 - 客觀、一致性 ◦ 測量工具 - 行為樣本、有效性被測量者測量者特質測量工具.

Advertisements

臨床能力評估測驗：OSCE 方信元Hsin-Yuan FANG MD PhD 中國醫藥大學附設醫院教學部副部主任

電腦軟體應用技能檢定考照說明.

海洋教育:教科書、教師與教學第七至十章導讀宏仁國中林珮瑜

105年牙醫師畢業後一般醫學師資培育-選修課程教學課程設計與評估方法

Lecture 7 試題分析試題分析的意義試題分析的目的試題分析的步驟試題難度分析試題鑑別度分析難度與鑑別度的關係選項分析.

这辈子只做一件家务，你会做什么？ A、拖地 B、洗碗 C、做饭 D、倒垃圾.

《传播统计学》作者：柯惠新祝建华孙江华.

5A 陳幸瑜(1) 朱栢霖(9) 林彩兒(16) 岑樂謙(22) 温頌嫻(28) 溫鎔而(29)

張瓊云藥師台中榮民總醫院藥劑部 Mini-CEX運用之經驗分享中榮張瓊云藥師台中榮民總醫院藥劑部.

人員招募與甄選林佩儀林彥伶曾雪玲古竺豔.

尊重价值规律.

104 學年度第二學期高中多元選修課程說明會 Calculus(I) 開課教師：老師開課教師： Mr. Math 老師2016/02/15.

西南财经大学实验经济学短期课程“实验的设计和具体操作”专题讲座

High-stake OSCE 考官核心課程 SP在高階OSCE的角色與常見問題

臨床教師培育研習營分享門診護理科梁素綺.

應用統計學授課大綱 – 暑期班 By: Dr. Tsung-Nan Tsai.

第7章量表的建立—補充 4.1 基本觀念 4.2 測量程序 4.3 測量尺度 4.4 良好測量工具的特性 4.5 信度測量

多變量分析 Multivariant Analysis

单元目标： ▲初步了解我国素质教育的由来 ▲全面把握素质教育的基本理念 ▲正确认识我国中小学素质教育实践中涌现的个案经验

研究方法徐南麗教授元培醫事科技大學護理系.

社会医学研究方法.

學習共同體實施心得分享新泰國中報告者張國振校長.

心理学研究方法 Research Methodology of Psychology 段锦云苏州大学应用心理学研究所

TQC+ JAVA全國教師研習會 PLWeb 程式設計練習平台簡介.

第十三章調查研究.

量化與質化的測量組員: 　　　　　　　　　　　　　　　　.

第8章態度的衡量與信度、效度的檢定 本章的學習主題 1.衡量的意義 2.衡量的尺度 3.衡量的指標 4.衡量尺度與統計分析 5.態度的意義 6.態度的衡量尺度 7.信度與效度的意義 8.衡量的誤差來源 9.信度與效度與其他相關因素的關係.

REGRESSION FOR ORDINAL OUTCOMES 「順序尺度依變項」的迴歸模型

第8章衡量方法及信度與效度的檢定  本章的學習主題  1.衡量的意義 2.衡量的尺度 3.衡量的指標 4.衡量尺度與統計分析

Marketing Research and Analysis

CHT IPv6測試 D-Link Taiwan 友訊科技台灣分公司 TTSS 電信技術支援課 Name:

员工的招募、甄选和录用东北林业大学经济管理学院田昕加

5 甄選國立中山大學企管系甄選.

臨床教學回饋技巧與能力評估長庚紀念醫院急診醫學科.

指導老師：蘇明俊老師組長：潘翠娥組員：張惠雅葉麗華

網路安全技術 OSI七層學生：A 郭瀝婷指導教授：梁明章.

第二版 © Copyright 版權所有：學富文化事業有限公司。本光碟內容僅提供教師於教學上使用，非經本公司許可，禁止複製 (給學生)。感謝老師的配合。

VIDEO COMPRESSION & MPEG

為成功制定目標和行動計畫國際獅子會分區主席訓練.

第十章補充允收抽樣.

網頁資料知多少? 事實 ? 謠言?.

哪些人是管理者？管理者？指和一群人工作，並藉由協調他人來完成工作，以便達成組織目標的人

Definition of Trace Function

信度分析 (11/7~11/13) 1.何謂『信度』 2.信度分析步驟.

臨床生理復健相關適性化評估測驗組員: 翁嘉遜、陳雅苹、吳蕙雯、陳愉婷、管玉芬、許全.

Measurement in Research

報告人: 范誠達指導老師:任維廉教授日期:2010/5/4

健體領域差異化教學策略簡報來源：教育部健體輔導群中央團

兒少保護通報處理流程介紹臺中市家庭暴力及性侵害防治中心陳秀婷/張美慧社工督導員 2012/10/19.

績效考核一.績效考核： 1.意義 2.目的 3.影響績效的因素二.要考核什麼? 三.誰來負責考核? 四.運用什麼工具與方法?

The viewpoint (culture) [观点(文化)]

嘉義市崇文國小製作者：林雅惠、張英燦、曾瑞媛日期：

Development of the Standardized Tests

MiRanda Java Interface v1.0的使用方法

教育概論教育原理與制度試題解題與分享第五組

第18章人力資源管理人力資源管理概論人力資源管理活動的層次現代的選才策略員工任用管理與激發員工潛能員工訓練發展計畫

黃影雯副教授講授 E_Mail Address:

PVQC-校內賽考生注意事項.

Chapter 13 測量之信度與效度分析. Chapter 13 測量之信度與效度分析潛在變數與衡量變數的關係在理論模型中的變數，通常很難直接衡量，我們稱為潛在變數（latent variables）我們必須找尋或設計出足以代表這些潛在變數的衡量指標，而這些指標則稱為衡量變數（measurement.

第一節績效考核週期第二節考核系統績效標準第三節績效考核的效標第四節績效考核的原理與原則結語

8 員工績效評估與績效管理. 8 員工績效評估與績效管理績效管理的主要目的理想的績效評估指標應該具備的特性如何運用各種績效評估的方法可能的績效評估資訊來源及360度回饋系統績效評估過程可能發生的偏誤如何成功的進行回饋面談人力資源管理：基礎與應用 ch8 員工績效評估與績效管理.

備審資料準備要領許書銘東海大學企管系主任.

Speaker : YI-CHENG HUNG

超我服務 Service Above Self

單元三：敘述統計內容：＊統計量的計算＊直方圖的繪製.

有趣的計算如果令A、B、C、D……X、Y、Z這26個英文字母，分别等於百分之1、2、3、4……24、

CHT IPv6測試 D-Link Taiwan 友訊科技台灣分公司 TTSS 電信技術支援課 Name:

Presentation transcript:

High-stake OSCE 考官核心課程

OSCE 評分標準化病人考官考題評估表

OSCE 評分信度 (reliability, repeatability, reproducibility) the ability to perform its functions consistently 效度 (validity) the tool measures what it claims to measure

信度信度是指可靠性或一致性信度好的指標在同樣或類似的條件下重複操作，可以得到一致或穩定的結果。通常用測試與再測試方法（test-retest method）來檢視一個指標的穩定信度，也就是將同樣的指標對同一群體重新施測，如果每次都得到同樣的結果，則此指標即有穩定信度。

效度指概念定義（conceptual definition）及操作化定義（operational definition）間是否契合。測量的效度比信度難達到。因為構念是抽象的，而指標則是具體的觀察。我們對於一個測量是否有效度並無絕對的信心，但可判斷是否比另一測量更有效度。

如何增進信度明確的概念化提升測量尺度的精確性使用多重指標使用預試（pretests）、前導研究（pilot studies）及重複測試（replication）

‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ OSCE 評分信度 (reliability, repeatability, reproducibility) 效度 (validity) ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧

OSCE 評分標準化病人 validity reliability 個案 validity 評估表 validity

考官訓練 Intra-rater Reliability 同一評分者在重覆多次的評分時機下能夠有一致的評分水準同一評分者在重覆多次的評分時機下能夠有一致的評分水準 Inter-rater Reliability 不同的評分者能夠認同公告所規定的評等標準不同的評分者能夠同意彼此的評分不同的評分者對於怎樣的表現算是好、怎樣的表現算是不好有共識

考官訓練寬鬆效應 (leniency effect, Kneeland 1929): rating the positive more positive 嚴苛效應 (severity effect, Ford 1931): rating the negative more negative 月暈效應 (halo effect): rating of a trait influences the rating of another trait 隨機效應 (randomness effect): 評分者沒有背景知識或訓練不足，以致於無法對量尺作出適當的區別，因而採用一種隨意的方式來對受試者進行評估。 http://www.bctest.ntnu.edu.tw/flying/flying41-50/flying43-5.htm

寬鬆效應& 嚴苛效應寬鬆效果係指評分者無論在何種情況下，有評高分的傾向；嚴苛效果就是評分者無論在何種情況下，皆有評低分的傾向。

月暈效應 (halo effect) 一個人表現好時，大家對他的評價遠遠高於他實際的表現反之，一個人表現不好的時候，別人眼中所認為的差勁程度，也會遠大於他真正差勁的表現。當評分者對某人某特質的評斷，是依據其對此人整體印象的優劣而定時，就有月暈效果。

考官訓練中央趨勢 (central tendency): 當評分者避免使用極端類別，而將評分集中於量尺的中間時，會使得評分較缺乏鑑別力，進而導致信、效度的降低。侷限效應 (restriction-of-range effect): 但中央趨勢專指評分集中於評分量尺中點附近；在侷限效果中，評分可集中於評分量尺中的任何一點邏輯誤謬 (logical error): 評分者相信某兩特質間有所關連，而給此兩特質相似或不相似之評等時，即有所謂之邏輯誤謬。 http://www.bctest.ntnu.edu.tw/flying/flying41-50/flying43-5.htm

考官訓練投射效果 (contrast error): 評分者傾向以自己與受試者作比較，但針對某種自己具有的特質，給予受試者和自己的評等卻完全不同。次序效果 (order effect): 受試者的受評次序會影響其所得的評等環境、評分者與受試者背景因素影響: http://www.bctest.ntnu.edu.tw/flying/flying41-50/flying43-5.htm

考官訓練那部份因素影響最大? 評量者心態 (Downing SM, Medical Education, 2005) 怎樣提升OSCE的評量者評量結果之客觀性? 訓練  基本假設…

考官訓練你為什麼要受訓? 大環境因素受訓者自我定位與角色受訓者內在與外在因素 (鞭子與胡蘿蔔)

考官訓練說明會影音演練 Discussion group Modified Delphi-Method

考官訓練體能訓練? 考試執行：全國採共同考題，每題測驗8分鐘。每日三場次，每場次考12人，每考場每日測驗 36人。自我承諾書 (Wilkinson, 2003)

提升客觀性 Direct Observation of Competence Training (Muller,1998; Holmboe, 2004; Angkaw, 2006) Performance dimension training Frame-of-reference training Behavioral observation training

評分表發展流程 Performance dimension training 臨床能力確認評估目標逐項目進行討論決定去留定義測量面向醫療面談臨床判斷專業素養身體檢查 Performance dimension training 決定評分方式checklist(有/無) 或是 Likert scale(1~5) 溝通技巧同理心確認訴求共同決策 … 每一面向拆解成數項欲測量項目逐項目進行討論決定去留

Frame-of-reference training 決定評分方式checklist(有/無) 或是 Likert scale(1~5) 例評分表發展流程確認評估目標 Mini-CEX Frame-of-reference training 定義測量面向醫療面談臨床判斷專業素養身體檢查決定評分方式checklist(有/無) 或是 Likert scale(1~5) 溝通技巧同理心確認訴求共同決策 OSCE / Scenario management 每一面向拆解成數項欲測量項目眼神接觸開放式問句逐項目進行討論決定去留不打斷病人談話未使用專有名詞

Behavioral observation training Role-play : Best VS. Worst

提升客觀性 Differential rater function over time (DRIFT) (Mclaughlin, 2009; Wolfe, 2001; Klein, 2003; Hopkins, 1998.) Rater fatigue 題目難與易? 15-20分鐘熱身 (warming-up) 可提升sensorimotor & cognitive performance?

提升客觀性籌備會議配題藍圖核心工作小組考題編修 (文字) 考題信效度測試 SP演出效度測試師資群訓練評分共識培訓專家指導考題信效度測試籌備會議配題藍圖 SP演出效度測試核心工作小組師資群訓練評分共識培訓師資群訓練評分共識培訓網路評分共識培訓 (出題、測試、評分考官) 網路影音平台得菲法評分共識建立

總結考官「薦」、「派」試場規則與保密 reliability 自我承諾書 (Wilkinson, 2003)

High-stake OSCE 考官核心課程 OSCE評分表與及格標準之制定原則

何謂標準設定？標準設定是一套合理的程序及準則，藉以產生一個分數，用以分辨出兩組應試者，或者是兩組不同程度的能力此標準要能服人(defensible) 產生一個決斷分數(cut-score)、門檻、通過分數譚克平教授提供

標準設定的目的定出每一站的及格分數系統性的方法能取信於人能經得起質疑證據為依據 28

評分系統建議評分項目10-15項採用評分尺標 0 , 1 , 2。最後有整體評分 1 ~ 5 分。 29

評分標準建議評分表評分項目逐項說明 Criterion-based design（同2011） Modified Delphi-method rater training Rating practice by Video + Real-time discussion forum on internet 30 30

及格標準設定實作評量之標準設定方法，大致可以歸納成三大類(Berk, 1984, 1986; Hambleton, 1990; Hambleton & Zaal, 1991)： 1. judgmental methods Nedelsky method Ebel method Angoff method 2. Empirical methods Livingston method Linden & Mellenbergh method 3. Combination methods Borderline-group method Contrasting-group method 31 31

OSCE及格標準設定建議 Borderline group method + regression(2011年採用）計算方法 Step 1. 令Y:考生的checklist總分 X:考生的global rating總分 Y=aX+b 求出每一站 a, b Step2. 以X=2.5帶入，得到每一站的及格分數，並得出不及格站數之考生 Step3. 將各站及格分數加總，得十二站總分之及格分數 32

Example from Boursicot(2003) y=ax+b 譚克平教授 33 33 33 33 33

OSCE及格標準設定建議 Angoff method（考試前訂定及格標準）執行方法請專家就每一個試題中，最低能力考生所可能答對之機率，進行評定。將每題可能答對之機率加總，便成為該專家所判斷的通過標準。再將數位專家之判斷的通過標準加以平均，便成為該測驗之最後的通過標準。 ■出題時同時訂定及格標準。 36

Angoff方法 􀁺1971 􀁺popular 􀁺很多變種 􀁺Modified Angoff 􀁺Extended Angoff 􀁺Yes/No 譚克平教授提供

Angoff方法學科專家開始時，評審團在會議中對所有題目做判斷想像minimally competent examinee的學生如有需要可彼此討論需發揮想像力答對的機率很多標準設定專家小組有10-15人譚克平教授提供

修正的Angoff流程目前並未有一致的定義 Reckase（2000）曾提出分為下述五個步驟進行： 1. 選擇設定標準的人員； 2. 訓練設定者。 3. 要求設定者定義並描述受試者應當達到的表現水準。 4. 令設定者估計（最低能力）受試者在每個試題上的表現。 5. 引導設定者檢視實徵資料，如：試題的難度水準（P值）。

Angoff方法譚克平教授提供

Angoff方法譚克平教授提供

瞭解評分表項目勾選 ←

考官注意事項評分時：評分表填寫。整體表現評直覺勾選一項。

考官注意事項考試結束後：每一考生結束時請確認評分表每一欄位皆已完成評分。待工作人員清點、確認後，始得離開考場。