教育測驗與評量 緒論 測驗與評量的意義 測驗與評量的種類 測驗與評量的功能 測驗與評量的發展趨勢
測驗的意義 測量的工具(Mehrens & Lehmann,1975) 。 對行為樣本所做的一種客觀的、標準化的測量(Anastasi, 1982)。 採用數字量尺或分類系統,來觀察或描述個人特質的一種系統程序(Cronbach, 1970) 。 採用一套標準的刺激,對個人的特質作客觀測量的系統程序(郭生玉,2004)。
名詞解釋 測驗(test):採用一套標準的刺激,對個人的特質作客觀測量的系統程序。 評量(assessment):在教學過程中,教師收集到質與量的資料,以作為輔導和評定學習結果之依據。 測量(measurement):了解學生學習程度,屬量的資料收集。 評鑑(evaluation):考核成效與輸入產生的關係。 1.內部評鑑:由學校人員考核成效。 2.外部評鑑:教育行政人員或專業人員至校考核。
測量的特性 個體具有可測量的特質。 心理與教育的測量是間接的。 測量都有誤差存在。 測量的解釋時常是相對的。
測驗的種類 認知測驗與情意測驗 文字測驗與非文字測驗 個別測驗與團體測驗 標準化測驗與非標準化測驗 客觀測驗與主觀測驗 速度測驗與難度測驗 最大表現測驗與典型表現測驗 預備測驗與診斷測驗 常模參照測驗與標準參照測驗 形成性測驗與總結性測驗
測驗的功能 做行政決定 做教學決定 做諮商與輔導的決定
測驗的發展趨勢 智力測驗舉例:比西量表、魏氏兒童智力量表、瑞文氏智力測驗、中華兒童智力量表 智力理論: 如G因素、三鼎智慧、多元智慧 趨勢:多元化、文化公平測驗(culture- fair test)
測驗的發展趨勢 性向測驗舉例:美術性向測驗、音樂性向測驗 應用:入學或編班、選才 趨勢:多元化、理論精緻化
測驗的發展趨勢 人格測驗舉例:情境測驗、投射測驗、自陳量表(語句完成測驗) 應用:臨床診斷、諮商與輔導 趨勢:理論精緻化、實用效果
測驗的發展趨勢 創造力測驗舉例: 創造力理論:獨創力、變通力、流暢力、精進力 應用:教育方案、團體競賽 趨勢:多元化、合作學習
測驗的發展趨勢 成就測驗舉例:基本學力測驗(基測)、學科能力測驗(學測) 、其它 應用:常模參照或標準參照、行政決定或教學決定 趨勢:建立常模、建立題庫、電腦化
評量的種類 依評量的目的及時機分: 1.安置性評量:教學前對學生起點行為方面的評量。目的在教學前對學生所具備的行為特質、學習特質和各種之能有所了解。 2.診斷性評量:在教學活動進行中,對於學生所呈現出的學習困難原因所做的診斷測驗。其目的在提供老師了解困難的成因以供補救教學參考。 3.形成性評量:教學過程中進行評量。 4.總結性評量:教學結束所做的評量。
依評量的標準(criteria)分: 1.常模參照評量:學生學習成果與別人比較(百分數) 2.標準參照評量:有一個標準,達標準即過關(如預官智力測驗)
傳統教學評量的缺失 1. 偏重總結性評量,忽略形成性評量。 2. 只著重視認知層面。 3. 屬於記憶層次的評量。(Bloom六個層面) 1. 偏重總結性評量,忽略形成性評量。 2. 只著重視認知層面。 3. 屬於記憶層次的評量。(Bloom六個層面) 4. 只重紙筆測驗。 5. 重常模參照評量,忽略標準參照評量。 6. 量的評量為主,忽略質的評量。 7. 為非人性化的評量方式。 8. 將教學與評量脫節。 9. 忽略評量主體性(多元式的,如自評、父母評) 10. 評量場所(環境)過於侷限。
變通性評量 替代性評量=變通性評量=另類評量= 不一樣的評量(alternative assessment)。 真實性評量(authentic assessment) 實作評量(performance assessment)
真實性評量(authentic assessment):測驗學生真實的能力,其實施必須以基本能力指標為內容,以觀察紀錄、實作表現分析、整理為方法。 特徵: 1.能讓學生在真實或虛擬情境中表現其知識或技能。 2.較能要求學生證明其較高層次之思考與問題解決能力。 3.不僅重視最後結果或作品呈現,亦強調獲致最後結果所經歷的過程。 4.學生需統整其所學的知識與技能,並以整體的方式表現出來。 5.較能從各種不同的角度反應學生的個別差異。
實作評量(performance assessment):實際表現、口頭報告、作品呈現、表演等,即指在學生發覺答案或創作作品過程中,評量學生知識、技能展現成果。
檔案(卷宗)評量(portfolios assessment):屬實作評量一種,紀錄學生學習階段、學習經驗、成品、札記、照相、性向,是一成長紀錄史,其目的在評量學生目前的表現以及進步的情形和正在發展的能力。
檔案評量的優點: 1. 使學生了解老師評量的過程。 2. 使學生、父母及教師能洞察學生學習進步情形。 3. 增加教師對實作評量重要性的了解。 4. 提供召開父母會議時主題內容的實例研究。 5. 使教學能集中於重要的行為表現活動上。 6. 幫忙評量課程需求。 7. 使學生知道行為表現的重要。 8. 提供可作為診斷的明確作品。 9. 對學生學習成果及感受情形作有系統的蒐集。
檔案評量的缺點: 1. 費時、費力且花錢。 2. 評分標準不易客觀。 3. 老師執行意願可能不高。 4. 不宜作為唯一的評量方式。
動態評量(dynamic assessment):(個人)師生互動過程中評量,前測(教學前)─介入(教學中)─後側(教學後),對學生的認知能力進行持續性的評量,以了解教學與認知改變的關係。
生態評量(ecological assessment):針對個體及其環境中各項因素,進行評量的過程。 特徵: 1. 以學生目前及未來可能接觸的環境為評量重點。 2. 評量是一個個別化的評量過程(一次一人)。 3. 強調如何透過各種形式或程度的輔助,幫助學生成功適應參與。
評量的發展趨勢 教學與評量統合化 評量專業化、目標化 評量方式多元化、彈性化 評量內容生活化、多樣化 評量人員多元化、互動化 結果解釋人性化、增強化 結果呈現多元化、適時化、全人化 評量避免誤用與濫用 評量電腦化、網路化 教師逐漸運用標準參照測驗 社會大眾、家長關心與期許 (李坤崇,1999:120-129)