十二年國教五堂課 多元評量樂學工作坊種子教師 培訓分享 新竹縣立 竹東國中 新竹縣 輔導員 黃錫裕 102年10月11日 資料來源: 教育部多元評量宣導簡報 台中市國中國文輔導團12年國教5堂課簡報 龍山國中 祈明輝<多元評量研發案例與經驗分享> 台師大 心測中心<以標準參照的評量促進教育發展- 十二年國民基本教育的關鍵配套> 國立高雄師範大學教育學系方德隆教授 <多元評量的理念與方法>
學習錐 (Edgar Dale) 兩週後我們大概會記得 涉入的本質 所讀的10% 閱讀 所聽到的20% 聽字 所見到的30% 看圖 被動 所讀的10% 閱讀 所聽到的20% 聽字 所見到的30% 看圖 被動 所聽見及見到 看電影 的50% 看展覽 看示範 看拍攝外景 參與討論 發言 主動 參與戲劇演出 模仿真實經驗 實際操作 所說的70% 所說及所作的90% (戴爾Dale ,1946) 資料來源:美國緬因州貝瑟市的全國訓練實驗室
(實體課程3小時) 五堂課18小時說明 (實體課程5小時 or 實體課程2小時+線上課程3小時) 推動說明: 第三堂課:有效教學策略 第一堂課:十二年國民基本教育理念與實施策略 (線上課程1小時) 第二堂課:適性輔導 (實體課程3小時) 第三堂課:有效教學策略 (實體課程5小時 or 實體課程2小時+線上課程3小時) 第四堂課:多元評量理念與應用 (實體課程6小時小時 or實體課程4小時+線上課程2小時) 第五堂課:差異化教學策略
五堂課18小時之後.. 十二年國教基本理念 1小時 有效教學 5小時 多元評量 6小時 差異化教學策略 3小時 適性輔導 3小時 有效教學 5小時 多元評量 6小時 差異化教學策略 3小時 適性輔導 3小時 標準評量推廣 2 小時 補救教學 8小時
十二年國民基本教育 中等學校教師 教學專業能力研習五堂課 多元評量理念與應用配合政策 自然與生活科技學習領域 十二年國民基本教育 中等學校教師 教學專業能力研習五堂課 (主政單位:教育部師資培育及藝術教育司)
大綱 壹、多元評量策略推動說明 貳、自然與生活科技多元評量示例 參、評量規準設定
壹、多元評量策略 政策推動說明
多元評量理念與應用辦理說明 「多元評量地方種子講師培訓工作坊計畫」。 緣由:為推動十二年國民基本教育政策,達成提升國 中小教育品質的願景。 由本署委託國立新竹教育大學張美玉院長辦理 「多元評量地方種子講師培訓工作坊計畫」。 為直轄市、縣(市)政府培訓種子講師,希望藉由種子講師回到地方對所有在職教師進行多元教學策略及多元評量方式之增能,以活潑課堂學習活動,激發學生潛能,培養學生主動積極參與學習的態度,進而激發學生學習動機與興趣,以實現適性揚才的教育理念。
多元評量理念與應用推動措施 培訓種子講師: 結合中央課程與教學輔導諮詢教師團隊 調訓各地方政府所屬輔導團輔導員進行培訓, 包含各學習領域之種子教師 國語文、英語、本土語言、數學、 社會、自然與生活科技、藝術與人文、 健康與體育、生活課程、綜合活動 研發多元評量之典範教學示例 :編擬國小及國中多元評量研習課程案例,自102年起透過地方種子講師及各地方政府輔導團推廣多元評量之典範教學示例。
多元評量理念與應用執行成效 101年10月底培訓完成各學習領域(含國語文、英語、本土語言、數學、社會、自然與生活科技、藝術與人文、健康與體育、生活課程、綜合活動)之種子教師總計405名。 101年12月底完成國小及國中多元評量研習課程案例。 102年度12月底各直轄市、縣(市)完成全國國中70%教師受培率。 103年度7月底各直轄市、縣(市)完成全國國中100%教師受培率。
中央課程與教學輔導諮詢教師團隊 政策宣導—多元評量與示例
多元評量理念與應用推動措施 「高層次認知領域紙筆評量設計實務」 「多元評量設計實務」 「檔案評量的設計與實施」 「各類評量教學示例發表」 研發課程內涵: 結合中央課程與教學輔導諮詢教師團隊規劃四大主軸課程(共6小時,包含講演與實作) 「高層次認知領域紙筆評量設計實務」 「多元評量設計實務」 「檔案評量的設計與實施」 「各類評量教學示例發表」
研習實務分享 多一點實作分享,少一點講授!
多元評量 法源依據
多元評量的法源依據 國民小學及國民中學學生成績評量準則 國民中小學九年一貫課程綱要能力指標 國中學生學習成就評量標準
國民小學及國民中學學生成績評量準則第3條 國民中小學學生成績評量,應依學習領域及日常生活 表現,分別評量之;其評量範圍及內涵如下: 一、學習領域:其評量範圍包括國民中學及國民小學 九年一貫課程綱要所定之七大學習領域及其所融入之 重大議題;其內涵包括能力指標、學生努力程度、進 步情形,並應兼顧認知、情意、技能及參與實踐等層 面,且重視學習歷程與結果之分析。 二、表現:其評量範圍及內涵包括學生出缺席情形、 獎、日常生活懲紀錄、團體活動表現、品德言行表現 、公共服務及校內外特殊表現等。
國民小學及國民中學學生成績評量準則第4條 四、方法:應符合紙筆測驗使用頻率最小化。 六、結果功能:應形成性及總結性功能並重;必 國民中小學學生成績評量原則如下: 一、目標:應符合教育目的之正當性。 二、對象:應兼顧適性化及彈性調整。 三、時機:應兼顧平時及定期。 四、方法:應符合紙筆測驗使用頻率最小化。 五、結果解釋:應標準參照為主,常模參照為輔。 六、結果功能:應形成性及總結性功能並重;必 要時應兼顧診斷性及安置性功能。 七、結果呈現:應質性描述及客觀數據並重。 八、結果管理:應兼顧保密及尊重隱私。
國民小學及國民中學學生成績評量準則第5條 國民中小學學生成績評量,應依第三條規定,並視學 生身心發展及個別差異,採取下列適當之方式辦理: 一、紙筆測驗及表單:依重要知識與概念性目標,及 學習興趣、動機與態度等情意目標,採用學習單、習 作作業、紙筆測驗、問卷、檢核表、評定量表等方式。 二、實作評量:依問題解決、技能、參與實踐及言行 表現性目標,採書面報告、口頭報告、口語溝通、實 際操作、作品製作、展演、行為觀察等方式。 三、檔案評量:依學習目標,指導學生本於目的導向 系統彙整或組織表單、測驗、表現評量等資料及相關 紀錄,以製成檔案,展現其學習歷程及成果。
國民小學及國民中學學生成績評量準則第11條 國民中小學學生修業期滿,符合下列規定者,為成績 及格由學校發給畢業證書;未達畢業標準者,發給修 業證明書: 一、學習期間扣除學校核可之公、喪、病假,上課總 出席率至少達三分之二以上,且經獎懲抵銷後, 未滿三大過。 二、七大學習領域有四大學習領域以上畢業總平均成 績丙等以上。 前項規定,自中華民國一百零一年八月一日以後入學 國民中小學之學生適用之。
國民中小學九年一貫課程綱要 自然科能力指標 1.過程技能:增進科學探究過程之心智運作能力 2.科學與技術認知:科學概念與技術的培養與訓練 3.科學與技術本質:科學是可驗證的、技術是可操作的 4.科技的發展:瞭解科學如何發現與技術如何發展的過程 5.科學態度:處事求真求實、喜愛探究之科學精神與態度、感受科學之美與影響力 6.思考智能:對事物能夠做推論與批判、解決問題等整合性的科學思維能力,以及資訊統整能力 7.科學應用:應用科學知識以及探究方法以處理問題的能力 8.設計與製作:能夠運用個人與團體合作的創意來製作科技的產品 培養學生帶得走的能力!!!
十二年國民基本教育的關鍵配套 國民中學學生學習成就評量標準 國民中學學生成就評量標準旨在建置與九年一貫課程綱要能力指標相對應的評量標準,補足目前九年一貫課綱各學習領域雖訂有能力指標,卻未提供評量檢核指標之不足,並作為全國教師在進行教學評量時的統一參照依據。 九年一貫課程綱要是有效教學的引領,國民中學學生學習成就評量標準是多元評量的引領。
多元評量內涵 一、教學策略多元,評量才能多元 。 二、評量貫穿整個學習過程。 三、學習應兼顧認知、情意、技能等能力。 四、質性評量應建立評量基準與規準。
教學與評量 一、教學與評量相輔相成:能提昇教學與學習成效 。 二、教學目標(學習結果)—是評量的基礎。 三、評量--在教學(前、中、後)過程中持續進行著。 非正式:口頭詢問、小組(班級)討論、觀察個人 、 學習單、實驗紀錄本、作業(習題)、…… 正 式:傳統評量——客觀式測驗、複雜成就測驗、 真實評量——實作、學習檔案、概念圖、……
教學—評量
評量 評量是運用科學方法和技術,蒐集有關學生學習行為及其成就的正確資料,再根據教學目標,就學生學習表現的情形,予以分析、研究和評斷的一系列工作。(簡茂發,民88) 評量係指教師蒐集、綜合、解釋有關學生的各種資料,以協助教師進行各種「教」與「學」決定的歷程。(李坤崇,1999) 評量是指所有用以獲取學生學習訊息的各類程序(觀察、表現或專題的評定、傳統紙筆測驗、延展式反應、真實作業表現)和對學習過程之價值判斷的形成。(測驗與評量:在教學上的應用/Robert L.Linn & Norman E.Gronlund 著,鄒慧英譯,洪葉文化,2003)
教學目標(學習結果) ——評量的基礎 帶著走的能力 教學 評量
評量—— 在教學過程中持續進行著
診斷評量 <<<<< 形成性評量 >>>>> 總結性評量 評量貫穿整個學習過程 教學 評量 安置測驗 小考 期中考 專案式學習評量 檔案評量 期末考 診斷評量 <<<<< 形成性評量 >>>>> 總結性評量 (from 2012 E-TEACHER Scholarship Program)
多元評量類型 實作 資料蒐集整理 鑑賞 筆試 口試---口頭問答 晤談 表演 實踐 檔案評量 自我評量 作業 同儕互評 報告---實驗報告 其他方式:概念圖 筆試 口試---口頭問答 表演 實作 作業 報告---實驗報告 【節自臺北市國民中學學生成績評量補充規定】
多元評量說明 依據 教學目標使用 評量類型 檔案評量 目的導向,系統彙整或組織紙筆與實作等相關紀錄,展現其學習歷程及成果。
紙筆評量應兼顧高層次認知領域 評鑑 Evaluate 創作 Create 分析 Analyze 應用 Apply 記憶 Remember 了解 Understand
多元智能(Gardner,1983) 技能 情意 認知 Gardner多元智能 內省智能: 音樂智能: 語文智能: 有效運用口頭語言和書面文字以表達自己想法和瞭解他人的能力。 肢體動覺智能: 善於運用肢體來表達想法和感覺,運用身體的部分生產或改造事物。 視覺空間智能: 能以三度空間來思考,準確的感覺視覺空間,並把內在的空間世界表現出來。 邏輯數學智能: 有效運用數字和推理的能力。 自然觀察者智能: 對生物的分辨觀察能力,對自然景物敏銳的注意力,對各種模型的辨別力。 內省智能: 正確自我覺察的能力,即自知之明。 人際智能: 覺察並區分他人情緒、動機、意向及感覺的能力,即察言觀色、善解人意。 音樂智能: 能察覺、辨別、改變和表達音樂的能力。 情意 認知
質性評量應建立評量基準與規準 對教師而言 對學生而言 (1)客觀評量,避免主觀的成 見或即定印象。 (2)能夠明確回應學生對於評 分高低的疑問。 (3)能夠節省教師在評估作業 及提供回饋所需時間。 (4)能夠幫助教師檢視並調整 課程目標與教學行為。 對學生而言 (1)知道成績的評量標準及 各等級範圍,引導正確 有效學習。 (2)可藉此知道自己的優缺 點,及未來應該朝何種 方向改進。 (3)可發展自我評估的能力 ,並為自己的學習負責 。
基準與規準的建立 1.選擇最適合本課程學習的目標 8.與學生溝通,確認同學瞭解評估的標準 2.根據學習目標發展評量項目 3.建立定義清楚的評估標準 4.決定三或四個不同等級的標準,如: 優秀、普通、不佳 5.訂出每個等級的分數範圍 6. 敘述的文字要淺顯易懂明確 7.對評量基準與規準不斷修正 8.與學生溝通,確認同學瞭解評估的標準
評量基準與規準 評量規準 學生表現等級(視需要調整) 評量基準 4分 3分 2分 1分 教學目標— 學生應該學習的基礎知識與技能 全部完成且表現其他優點 全部完成 部分完成 幾乎沒有完成 學生表現等級(視需要調整)
評量基準與規準示例 評量規準 評量基準 3分 2分 1分 學生能突破性別刻板的限制,設計學校的廁所標誌。 能設計無性別刻板印象的廁所標誌,並說明設計理念。 只能設計無性別刻板印象的廁所標誌,或只會說明設計理念。 需要幫助才能設計無性別刻板印象的廁所標誌,或才會說明設計理念。
貳、自然與生活科技學習領域 多元評量示例
評量的設計與功能 以學生的學習經驗為主要的評量內容。 以適切的方式評量,內容應是重要概念且與日後學習相關者。 評量能協助學生改善學習效果。 評量能幫助學生面對生活情境,以及發揮問題解決的能力。 評量著重學生運用科學認知、過程技能以及思考智能的歷程。
口語評量
口語評量的理念與作法 兼具總結性與形成性評量的目的 型式:提問、口試、晤談、口頭報告等 從師生對話中蒐集學習證據,瞭解學生的學習狀況與學習需求,立即給予學生回饋或是做出教學決定以促進學習。 有效率的問題可以提供教師更多瞭解學生的機會。
口語評量的理念與作法 Bloom 分類法 創作 評鑑 分析 應用 理解 記憶 Anderson, L.W.2001
Bloom 分類法 記憶層次問題-例如:給出…的定義,誰做了什麼,什麼時候發生了…,有多少…。 理解層次問題-例如:這是如何發生的,為什麼會發生,舉一個例子說明…。 應用層次問題-例如:這個概念可以應用在什麼地方? 分析層次問題-例如:根據……把……歸為這一類,比較或對照……,假若…發生了,接下來……可能會發生。
Bloom 分類法 評鑑層次問題-例如:你同意…?對於…你認為…?你要如何做抉擇?你是用什麼標準來評估…。 創作層次問題-例如:請你依這個概念,預測或推論…接下來的發展情形,或你要如何創造或設計一個…,你建議的策略或做法是…
編寫評量問題的自我檢視~評量金字塔 難 自我發展 生活經營 社會參與 保護自我與環境 問題難易度 易 綜合活動課程目標 思考的層次 再製 連結生活經驗 分析或創作 思考的層次 易 難 問題難易度 綜合活動課程目標 自我發展 生活經營 社會參與 保護自我與環境
口語評量的理念與作法 評量金字塔 思考層次一的問題通常是短答題、選擇題與填空題,這類的問題通常是孤立存在,只要求單一的解答或解題策略。(例如:酸鹼中和反應的產物) 思考層次二的問題常是開放性問題,需要學生整合手邊既有資訊,跨領域思考解決策略。(例如,檢視提供的化合物與元素種類,那些可能會產生反應。)
評量金字塔 口語評量的理念與作法 思考層次三的問題也是開放性問題,最不容易設計,它要求學生分析、解釋與看出問題背後的現象。 學生常要從不同角度思考,提出創新的看法與解決的策略。 例如,面對道德兩難的問題,學生得從生命教育、社會文化、倫理學、生物學等角度綜合分析探討。
評量表---口語評量(規準) ~大家可視自己的需要加以調整 符號 A B C D E 內容 豐富 項目符合, 內容詳明豐 富。 項目符合 ,內容適 中 項目大部 分符合, 內容不足 或過少 項目缺 漏,內容 也不足 未做 或未 交。 參與 態度 認真努力完 成報告。 用心程度 普通 不夠用 心。 敷衍草 率。 創意 構想 擅用各類媒 材,做極佳 表現 表達方式 稍有創意 表達不見 創意。 毫無創 意,或完 全抄襲 團隊 精神 合作無間, 團隊合作好 團隊合作 表現不錯 稍嫌不足 未見合 作。 表達 效果 敘述完整且 表達效果好 敘述言簡 意賅。 表達效果 不夠顯著 表達不順 暢
符號 評語 A B C D E 內容 豐富 項目符合, 內容詳明豐 富。 項目符合 ,內容適 中 項目大部 分符合, 內容不足 或過少 項目缺 漏,內容 也不足 未做 或未 交。 參與 態度 認真努力完 成報告。 用心程度 普通 不夠用 心。 敷衍草 率。 學生自訂
進行口語評量問題設計時,利用「Bloom認知 分類」與「評量金字塔」做問題檢測工具。 有效的評量問題,幫助教師找出學生的學習 進展、迷思概念與學習落差。教學與評量必 需整合,教師可從評量獲得的資訊自我反思 教學。 合適的評量不只協助學生學習,更可促進教師專業成長。
高層次認知領域 紙筆評量設計
安全責任運輸|快遞
百事可樂
睫毛膏
貓食罐頭
瑞士刀
殺蟲劑
啤酒
海尼根
酒後勿開車
汽車廣告
快乾油漆
酒後勿開車
命題除了要有創意 更重要的是 要能檢驗學生學習 符合評量的目的
學生紙筆表現 (國文科)
學生紙筆表現 (數學科)
學生紙筆表現 (社會科)
學生紙筆表現 (英文科)
學生紙筆表現 (數學科)
學生紙筆表現 (數學科)
學生紙筆表現 (數學科)
一般命題原則概說 測量重要的概念,避免偏重純粹的記憶,重視融會貫通的能力。 內容均勻分佈,參考雙向細目表。 題目簡明扼要。 有公認的正確答案。 每個試題獨立,不相互牽涉。
教學目標(橫軸) 以Bloom所提的認知領域6個教學目標為依據:記憶、了解、應用、分析、評鑑、創作。 有些成就測驗將分析、評鑑、創作,統合成「高層次思考」。 為了建立學生信心,高層次思考佔分最高約25%。
2001年版Bloom認知領域教育目標 知識 向度 認知歷程向度 1.記憶 Remeber 2.了解 Understand 3.應用 Apply 4.分析 Analyze 5.評鑑 Evaluate 6.創作 Create A.事實 知識 B.概念 知識 C.程序 知識 D.後設 認知 知識 從長期記憶中取回有關知識 確認(再認) 回憶 從口述、書寫和圖像溝通形式的教學資訊中建構意義 詮釋(說明) 舉例 分類 總結 推論 比較 解釋 面對某情境執行或使用一個程序 實行 執行 分解整體為許多部分,並決定各部分彼此和與整體結構或目的關係 辨別 組織 歸因 根據規準和標準下判斷 檢查 評論 集合要素以組成一個具協調性或功能性的整體,重組要素為一個新的模型或結構 通則化(產生) 規劃 製作 (布魯姆認知領域教育目標分類修訂版之探討,暨南國際大學教育政策與行政研究所助理教授 葉連祺、高雄縣政府教育局國民教育輔導團幹事 林淑萍,教育研究月刊 105 期)
雙向細目表概說 表示測驗的架構藍圖,描述測驗包含的內容以及評量到的能力。 以教學目標(橫軸)和學習內容(縱軸)為兩個軸,分別說明各項評量目標和內容的關係。 考前考後皆可使用。
學習內容(縱軸) 出題的範圍,表示出包含哪些不同的單元。
雙向細目表簡例 教學目標(能力層次) 知識 理解 應用 分析 評鑑 創作 合計 ︵ 學 單 習 元 內 名 容 稱 ︶
選擇題的命題原則1/2 題幹宜完整,避免分割成兩部分。 題幹少用否定的敘述。 選目盡量力求簡短,必要敘述放置於題幹。 選目一致,三到五個,學生較不會答錯位置。 誘答選目應具有似真性。
選擇題的命題原則2/2 選目避免暗示正確的答案。 選目之間避免重疊。 選目盡量少用「以上皆非」、「以上皆是」。 如屬最佳答案題型,務必確信只有一個最清楚的答案。 正確答案出在各選目的次數宜接近相同,須隨機排列。
學生紙筆測驗怕學生作弊現況
學生紙筆測驗怕學生作弊現況
這樣監考的老師傷不起啊!堅決不給學生留一條生路啊~
一個真正的學習高手不僅能在一場考試中狂砍90分+ 而且能送出許多60分+的助攻....
現在的孩子們都太厲害了!這是被考試逼成什麼樣了啊!
國中基本學力測驗的測驗指標 能力層次 項目舉例 一、具備自然科學的基礎知識 1-1 知道科學名詞、符號或計量單位 1-2 知道科學現象、規則、學說、定律 1-3 知道工具的使用方法 1-4 知道科學研究的方法 二、運用資料和圖表的能力 2-1 能理解數據、反應式、數學式或圖形的意義 2-2 能選用圖文中適當的資料 2-3 能轉換資料與圖表間之呈現方式 三、具備高層次思考的能力 3-1 能運用基礎知識解決問題 3-2 能分析比較物象間的關係 3-3 能提出合理的推論與結論 四、統整學科知識的能力 4-1能綜合自然學科各學門相關知識並加以運用 4-2 能了解自然科學的侷限性 4-3能了解自然科學與人類文明及環境間的互動
試題舉例 建構反應試題 國際大型科學測驗 TIMSS科學試題 PIRLS科學試題 PISA科學試題 借鏡他山 美國 上海 日本 新加坡
建構反應試題概述
SR vs. CR試題 Selected-response items—一個題幹(stem)與一組選項(alternative response),學生由選項中選出一個答案。 Constructed-response items—一個題幹(stem, prompt, exercise),學生必須自行寫出答案來。
建構反應試題 Constructed-response (CR) items,亦稱為free response items。 包括simple completions, short essays, long essays (term paper length), public speaking, artistic projects, group interactions, science projects and assorted types of portfolios等。
建構反應試題的命題原則 Hogan, T. P. & Murphy, G. (2007). Recommendations for preparing and scoring constructed-response items: What the experts say. Applied Measurement in Education, 20(4), 427-441. 歸納自25本教科書和章節所得到的結果。
使CR試題有利於評量的效度1 1. 每一個CR試題應直接由教學目標(呈現於測驗藍圖、細目表或內容標準中)產生。 2. 找出特別適合CR題的教學目標(比較不適合用SR題),尋找更複雜或更高階的心理歷程。
使CR試題有利於評量的效度2 3. CR試題通常所遇到的難題是題意不夠清楚,因此要(A)小心用字遣詞,以使試題能夠專注在所要測量的反應;(B)提供合理的指導(例如時間限制、分數);(C)確定用字語彙是考生合適的;(D)請同事幫忙讀過試題以確定題意足夠清楚。
使CR試題有利於評量的信度1 1. 避免使用optional items,允許考生選擇想要作答的試題會使得考生之間的比較受到影響(危害)。 2. 在準備CR試題的同時,界定如何計分(這會幫助計分規準[scoring rubric]的形成)。
使CR試題有利於評量的信度2 3. 寧可試題多一些,而每題所需的作答時間短一點,也不要題目少,而每一題所需的時間長(當然也有人建議題目少,而每議題所需的時間多一些,但是題目多,通常信度係數會高一點)。
CR題的計分原則的建議1 使用可確保計分過程的公平性和效度的計分程序: 1. 匿名計分,且若要評分的題目比較多時,建議評分每一個題目時,都將試卷重新洗排,以使考生出現的次序不同。 2. 使用一個專注在測量目標的計分規準,不要讓無關的因素(文法、寫作技巧、錯別字)影響分數。
CR題的計分原則的建議2 使用可使分數的信度最大化的計分程序: 1. 使用計分規準(清楚定義的計分程序),且在評分的過程中,得常常回來參考評分規準。可能時,可以先閱讀過數份學生的作答反應,然後再開始評分。 2. 如果有多個CR題需要計分時,一次只改一個題目的分數,等全部考生該題的分數都改完後,再改下一題。
CR題的計分原則的建議3 使用可使分數的信度最大化的計分程序:
TIMSS簡介
關於TIMSS 1 Trends in Mathematics and Science Study(TIMSS)是國際教育成就調查委員會(The International Association for the Evaluation of Educational Achievement, IEA)自1995 年以來連續每四年一個週期所舉辦的數學和科學教育成就趨勢調查。
關於TIMSS 2 TIMSS 主要目的在提供各國長期追蹤學生數學和科學成就的趨勢與課程、教學、學習環境、家庭背景、以及教師等影響因素的相關資料,以了解各國在其教育改革或課程改革等改進措施的成效。 另外,因為有近五十個國家的參加,故也提供了各國在教育實務上執行方法不同而獲致不同教育成果的各項資訊,作為各國在從事教育改進的參考。
關於TIMSS 3 此研究計畫的目的在藉參加此大規模的國際性學生學習成就比較測驗,來了解我國國小四年級及國中二年級學生的數學與科學學習成就情況及在國際間比較的結果。 並與1999 年(只含國中二年級部分)參加的第三次國際數學與科學教育成就研究後續調查(TIMSS 1999)的結果作比較,其結果可作為我國數學和科學教育實施與改進的參考,也可提升我國數學和科學教育研究水準。
student skills and abilities TIMSS 認知領域 cognitive Domains student skills and abilities Knowing 知道(認識) covers science facts, procedures, and concepts students need to know 回憶/再認、定義、描述、舉例說明、展現使用科學儀器的知識 Applying 應用 focuses on the ability of the student to apply knowledge and conceptual understanding in a science problem . 比較/對照/分類、運用模型、連結、詮釋資料、尋求解答、解釋 Reasoning 推理 goes beyond the solution of routine science problems to encompass unfamiliar situations, complex contexts, and multi-step problems. 分析、統整/綜合、假設/預測、設計/計畫、結論、歸納、評鑑、驗證
歷年成績表現
TIMSS試題示例 1 小玲用同樣大小的方塊堆積木,每層用10個方塊,共堆了5層,請問這堆積木用了多少個方塊? (1) 5個方塊 (2) 15個方塊 (3) 30個方塊 (4) 50個方塊 (2003四年級)
TIMSS試題示例 2 一張桌子可以坐4人。如果有28個人,你要用什麼方法找出需要幾張桌子呢? (1) 28乘以4 (2) 28除以4 (3) 28減4 (4) 28加4 (2007四年級)
TIMSS試題示例 3 下列哪一個是由最大排到最小? (1) 36, 43, 66, 87 (2) 66, 43, 36, 87 (3) 87, 66, 36, 43 (4) 87, 66, 43, 36 (2003四年級)
PIRLS簡介
促進國際閱讀素養研究(PIRLS) PIRLS全名為Progress in International Reading Literacy Study,是由國際教育成就調查委員會(International Association for the Evaluation of Educational Achievement; 簡稱IEA)所主持的計畫。 目的在研究世界各國及地區四年級兒童的閱讀能力。 5年一循環 台灣在2004年加入。
PIRLS對閱讀素養的定義 學生能夠理解並運用書寫語言的能力 能夠從各式各樣的文章中建構出意義 能從閱讀中學習 參與學校及生活中閱讀社群的活動 由閱讀獲得樂趣
2006 結果 名列前五名者:俄國、香港、加拿大(亞伯達省)、新加坡、加拿大(卑斯省) 俄國、香港、新加坡由2001到2006有長足進步
台灣學生閱讀成就 排名22 45個國家和地區參加PIRLS 2006研究,全體學生平均分數500分。 最高分國家學生平均565(3.3)分 台灣學生平均536(2.0)分 排名22
香港 新加坡 台灣 22名 國立中央大學學習與教學所 2017/3/16 111
PISA簡介
What’s PISA ? Programme International Student Assessment 國際學生能力評量計畫 學校 老師 教育 生活 國際學生能力評量計畫 OECD 學生 教學
What’s OECD? Organisation Economic Cooperation Development 經濟合作暨發展組織 34 個會員 超過 41 個夥伴 15歲學生面對未來學習或工作挑戰的準備程度如何? 15歲:已經完成義務教育(國三或高一學生) 具備參與未來社會所需的基礎知識和技能
1 2 3 What’s PISA 評量? 閱讀 數學 科學 電腦化評量: 問題解決、數學和閱讀 全面電腦化評量 自2000年開始 43 個國家/地區 第二輪: 2009(65) 數學 第二次: 2003(41) 科學 第二輪: 2012(67) 電腦化評量: 問題解決、數學和閱讀 第三次: 2006(57) 臺灣第一次參加 第二輪: 2015 全面電腦化評量 每個國家正式施測的學生約4,500~10,000之間 PISA 2009 全球共計有47萬學生參與
PISA 評量週期 PISA評量自2000年開始,每三年調查一次。 每次調查以一個領域為主進行深度了解, 另二個領域為輔。 2000 - 閱讀、2003 - 數學、2006 - 科學、 2009 - 閱讀、 2012 - 數學 、2015 - 科學。
PISA評量什麼1 PISA是一項以年齡為導向的調查研究,採取素養(literacy)的觀點設計測驗,測驗的內容主要分為三個領域:閱讀素養、數學素養及科學素養。 重點在於評估接近完成基礎教育的十五歲學生,是否能將在校習得的知識與技能應用於進入社會後所面臨的各種情境及挑戰。
PISA評量什麼2 換句話說,PISA所評估的是,學生對於日常生活中可能接觸到的各種文書資料,運用其閱讀能力所能達到的理解和詮釋的程度;運用數學知識和技能去解決數學相關的難題及挑戰所能達到的程度;以及運用科學知識和技能去了解、解釋和解決各種科學情境及挑戰所能達到的程度。 這三種素養不僅是學校課程的核心,也是成人社會所需具備的重要知能。
歷次 PISA 科學調查結果 PISA 2000 PISA 2003 科學 排名 暨平均分數 1.韓國 (552) 1.芬蘭 (548) 2.日本 (550) 1.日本 (548) 3.芬蘭 (538) 3.香港 (540) 4.英國 (532) 4.韓國 (538) 5.加拿大 (529) 5.列支敦士登 (525) 6.紐西蘭 (528) 5.澳大利亞 (525) 6.澳大利亞 (528) 5.澳門 (525) 8.奧地利 (519) 8.荷蘭 (524) 9.愛爾蘭 (513) 9.捷克 (523) 10.瑞典 (512) 10.紐西蘭 (521) PISA 2006 1.芬蘭 (563) 2.香港 (542) 3.加拿大 (534) 4.臺灣 (532) 5.愛沙尼亞 (531) 5.日本 (531) 7.紐西蘭 (530) 8.澳大利亞 (527) 9.荷蘭 (525) 10.列支敦士登/韓國 (522) PISA 2009 1.上海(575) 2.芬蘭(554) 3.香港(549) 4.新加坡(542) 5. 日本(539) 6.韓國(538) 7.紐西蘭(532) 8.加拿大(529) 9.愛沙尼亞(528) 10.澳大利亞(527) 12.臺灣(520)
PISA 2006台灣科學素養 形成科學議題能力(第十七名) 解釋科學現象能力(第三名) 科學論證能力(第八名) 科學本質(第十名) 測驗結果分析 PISA 2006台灣科學素養 形成科學議題能力(第十七名) 解釋科學現象能力(第三名) 科學論證能力(第八名) 科學本質(第十名) http://www.nc.hcc.edu.tw 100國中自然區策
2009年臺灣學生樣本描述 學校類型 施測學生 數(人) 百分比(%) 母群學生數(人) 母群學生數 國中 1,538 26.4 87,927 26.8 高中高職 高中 731 12.5 68.6 35,005 10.7 69.5 高職 533 9.1 31,812 9.7 高中職混合 1,391 23.9 84,371 25.7 完全中學 (國中、高中) 562 9.6 34,951 複合學校 (國中、高中、高職) 787 13.5 41,645 12.7 五專 289 5.0 12,293 3.7 總數 5,831 100 328,004 100.0 註:國三與高一人數比例約為1:2
PISA試題示例1 蒼蠅(一) 閱讀下列短文,並回答下列問題。 有位農夫在農業試驗所,擔任乳牛的管理工作。牛舍裡蒼蠅很多,影響動物健康。
PISA試題示例2 於是,農夫再度噴灑一次這種殺蟲劑。這次的噴灑效果,與第一次噴灑的效果相似。雖沒有殺死全部蒼蠅,但讓大多數蒼蠅死亡。再經過一段時間,蒼蠅又很多。於是,又再一次的噴灑殺蟲劑。這樣的事情一再發生,總共噴灑了五次殺蟲劑:結果很明顯的,「殺蟲劑A」殺死蒼蠅的效果越來越差。
PISA試題示例3 農夫注意到了他的噴藥過程,他先配好一大瓶的殺蟲劑溶液,這五次噴藥都用這一瓶溶液。因此,殺死蒼蠅效果越來越差的可能原因,農夫所提出的建議是:殺蟲劑因存放時間過久而分解。 來源: Teaching About Evolution and the Nature of Science, National Academy Press, Washington, DC,1998, p. 75.
問題1:蒼蠅 農夫所提的建議是:殺蟲劑因存放時間過久而分解。如何驗證這個建議?請簡要說明之。 ...............................................................................................................................
計分規準1 蒼蠅 問題1 計分 題旨: 過程:確認證據 主題:化學與物理變化 範疇:生命與健康科學
計分規準2 滿分 代號 5:應用三個變因(蒼蠅的品種、殺蟲劑的存放時間、與暴露)的控制,進行問題的回答。例如:選擇品種相同,不曾暴露過殺蟲劑的一群蒼蠅,將這群蒼蠅分為兩組。其中一組用新配製的殺蟲劑噴灑,另一組則用配製後存放較久的殺蟲劑噴灑,比較兩組的殺蟲效果。
計分規準3 部分分數 代號 4: 三個變因(蒼蠅的品種、殺蟲劑的存放時間、與暴露)中,只應用其中兩個變因的控制,進行問題的回答。例如:比較新配製的殺蟲劑與存放較久的殺蟲劑,兩者對牛舍蒼蠅的殺蟲效果。
計分規準4 代號 3: 三個變因(蒼蠅的品種、殺蟲劑的存放時間、與暴露)中,只應用其中一個變因的控制,進行問題的回答。例如:針對此一殺蟲劑,定期取樣,並進行化學分析,以了解殺蟲劑是否隨存放時間的增加,而產生化學變化。
計分規準5 代號 2: 使用新配製的殺蟲劑噴灑蒼蠅,但沒有提及與舊的那一批殺蟲劑做比較。 代號 1: 這種殺蟲劑的樣本的化學分析,但沒有提到不同存放時間的樣本之分析比較。 注意:假如只提及將殺蟲劑的樣本,送到實驗室。則編碼為代號1。
PISA所提供此題的作答範例1 代號 5: • 你可以捕捉一些蒼蠅,將牠們放在兩個箱子裡,你可以使用新配製、存放較久的兩種殺蟲劑,分別噴灑這兩箱子中的蒼蠅,以觀察結果是什麼。[雖然沒有提到相同品種,但此回應暗示了,蒼蠅是同一品種,而且這些蒼蠅以前未曾暴露過] • 配製一批量多一點殺蟲劑。取兩組蒼蠅,每六個月噴一次殺蟲劑。第一組使用體積較大的這一批殺蟲劑,第二組則每次都用新配製的殺蟲劑。[雖然沒有提及相同品種,但此一回應暗示了蒼蠅是同一品種,而且這些蒼蠅以前未曾暴露過]
PISA所提供此題的作答範例2 代號 4: • 試著配製新的一瓶,過一段時間,等這瓶殺蟲劑有些舊了,而蒼蠅回來時,再用這瓶殺蟲劑試驗。[控制殺蟲劑的存放時間與蒼蠅的品種,以探討這位農夫的經驗是否具再現性。「蒼蠅」可解釋為同一品種的蒼蠅] 代號 3: • 每隔幾個月,從此一殺蟲劑中取一些當作樣本,帶到實驗室並測試樣本的 效用。 代號 2: • 執行和農夫相同的噴藥的工作,但每次噴藥都買新的殺蟲劑,以此證明農夫的理論是正確或錯誤的。
PISA所提供此題的作答範例3 代號 1: • 假如他配製新的一批藥,將這批新的藥和那批舊的藥寄到實驗室,重複驗證這個結果,或許可以證明他的理論。 代號 0: • 他可以每年測試殺蟲劑一次,以觀察殺蟲劑是否仍未過期,還可以使用。[沒有指出如何測試殺蟲劑] • 從農夫的牛舍以及另一間牛舍,各捕捉一隻蒼蠅。用這種殺蟲劑分別噴這兩隻蒼蠅。
問題2:蒼蠅 為什麼:「殺蟲劑A 殺死蒼蠅的效果愈來愈差…」。農夫的解釋是:殺蟲劑因為存放時間過久而分解。除了農夫的解釋之外,請你舉出兩個不同的解釋。 解釋1: ................................................................................................................................................................................................................................................................. 解釋 2: .................................................................................................................................................................................................................................................................
AHELO簡介
AHELO──OECD高等教育學習成果評量計畫 ● 學生學習成果的測驗範圍與方法 1.共通能力(generic skills) 意即所有的學生在大學教育中會學到的能力,包含批判思考、邏輯分析、問題解決與寫作溝通等能力。 共通能力的測驗工具,是修改自美國教育補助委員會(Council for Aid to Education, CAE)所發展的「大學生學習評量」(Collegiate Learning Assessment, CLA)。此份「大學生學習評量」已廣泛使用於美國各大學。在AHELO計畫中,學生有90分鐘的時間完成兩項任務。其中一項屬於綜合性任務,要求學生必須運用其整合的共通能力,回答數個假設性(但可能實際發生)的開放性問題,並從各類資料中(如信件、研究摘要、地圖、圖表等)歸納整理出頭緒或線索,方能完成任務。
AHELO──OECD高等教育學習成果評量計畫 2.學科專業能力(discipline-specific skills) AHELO計畫先針對經濟學(economics)與工程學(engineering)兩大科目進行研究,因為這兩大科目即使在不同的國家文化裡,知識內容也是相近的。測驗的內容並非死板的知識條目,而是學生如何將所學確實運用在環境中的能力。 (1)經濟學測驗 具體而言,AHELO的經濟學測驗著重在學生能否「用經濟學的語言來解決現實生活中的問題」。此牽涉到基本的經濟學知識,以及概念應用、評估工具使用、資料分析,並且將結果用適當的語言表達、讓他人理解的能力。 (2)工程學測驗 而工程學長久以來已發展出國際互通的標準。一位工程師應具備何種能力,在國際上已有完整的界定,並被多數國家採用。AHELO的工程學測驗,目的為了解學生「在應用工程學概念、使用統計與非統計工具,擬定結論,以及提出相關建議與策略的能力」。
AHELO──OECD高等教育學習成果評量計畫 3.學習情境資訊(contextual information) 以問卷調查的方式了解學生學習的背景與情境狀況為何,分為教師、學生與學校三大面向,著重於大學教育的輸入與過程(input and process),包含學生就讀大學時已具備的初始知識技能(initial knowledge and skill)為何、課程設計、學生對學習的投入程度、教學資源與教學品質等。 學習情境資訊。調查所得的資料可以與評量而得的成果進行比較分析,以了解對於什麼樣的學生,在什麼樣的學習情境下會獲得什麼樣的學習成果。同時,也可歸納出評量分數高的學校,其學習情境的特點為何,提供學校更具體精準的建議,協助他們改善教學品質。這些資料對於未來相關研究的發展,也相當寶貴。
臺灣師範大學──大學生素養測驗 台師大研發的「大學生基本素養測驗」,主要參考21世紀技能評估與教育行動計畫(ATC21S)、學生能力評量計畫(PISA),以及國際數學與科學教育成就趨勢調查(TIMSS)等多項國際大型研究計畫,發展出溝通合作、美感素養、科學思辨、資訊素養、終身學習、創新領導、問題解決、公民社會、生涯發展共九大基本素養。 題庫主要分成「認知能力」與「情意態度」兩大塊,合計總總題數超過700題,每次測驗時,將從題庫中隨機抽選題目組成多媒體測驗題組。
臺灣師範大學──大學生素養測驗 例題:要求學生觀看一段捷運車廂內遇到身障人士與老人, 卻沒人肯讓座的動畫影片,要學生回答主角該如何說 服有座位的陌生人讓座比較合適。 題目選項: 我知道你現在很累,但是比起行動不便的人,應該還 是可以忍受吧! (B)看到需要的人讓位是很正常的事情阿!小學的生活與倫 理不是就有教了。 (C)換個立場想想,如果今天是你行動不便,你一定也會希 望別人讓位給你吧! (D)國中生不一定會讓位與其等他們讓位,不如我們自己讓 比較實際吧! 學生必須選擇選項一才有分數。
TASA簡介
TASA建置主要目的1/2 一、建立國民中小學、高中及高職學生學習成就長期資料庫,以追蹤、分析學生在學習上變遷之趨勢,進而檢視目前課程與教學實施成效。 二、提供完整、標準化的學習成就資料,作為分析學生學習成就上差異表現變項資料,以評估學生未來在學術方面能力之發展與社會期許。 三、瞭解國內學校教學及學生學習成效之現況,作為課程與教學政策改進之參考,並為縣市政府教育局及學校推動補救教學之重要參據。
TASA建置主要目的2/2 四、提供各縣市學生學習表現資料,建立與縣市合作機制,以擴大資料庫應用效益。 五、以資料庫的量化資料,提供國內外相關研究人員,深入探討學生學習成就方面的相關政策議題。 六、建立本國學生學習成就評量資料庫,同時考慮與國際接軌,利於加入國際比較行列,藉以瞭解臺灣教育之獨特面與優缺點。(http://tasa.naer.edu.tw/plan.htm )
臺灣學生學習成就評量(TASA)認知歷程向度 知道 對科學現象、過程、與概念具備定義、記憶、描述的能力。 理解應用 理解及應用科學概念到適當情境的能力 統整推理 整合或推理應用不同科學概念到新情境的能力。
實作評量 ——以實驗操作評量為例
實作評量 實作評量係指根據學生實際完成一項特定任務或工作表現所作的評量。這些任務或工作,可能是實際操作、口頭報告、科學實驗、數學解題、寫作…等。 (吳清山、林天祐,教育資料與研究雙月刊 第15期,86.03)
強調的是「做」,而不僅是「知」,同時過程與結果並重。如科學實驗:實驗儀器操作,設計實驗、執行實驗的技巧,觀察、紀錄、解釋結果的技巧。 Robert L.Linn & Norman E.Gronlund(鄒慧英譯)(2003),測驗與評量:在教學上的應用(Measurement and Assessment in Teaching),臺北市:洪葉文化。
發展實作評量 Step 1:決定評量甚麼 Step 2:設定評量題目 Step 3:訂定評分範例(規準、檢核表) Gary D. Borich(郝永崴等譯)(2007),有效教學法(Effective Teaching Methods),臺北市:五南出版社。
舉例:測量物體的質量 基準 一、能寫出上皿天平的基本構造(含砝碼)等 4 項: (a)秤盤,(b)指針,(c)校準螺絲,(d)砝碼。 二、能操作上皿天平測量物體的質量 1.使用天平測量物體質量前,能調整校準螺絲的位置,使天平先「歸零」。 2.能使用鑷子夾取或放置砝碼。 3.能將待測物體與質量較大的砝碼,置於秤盤的中央。 4.能正確記錄待測物體的質量(500mg)。 5.能利用「平均值」的方法,測量「1 只」迴紋針的質量。
評量規準(Scoring Rubrics) 表現 項目 1 2 3 4 5 認識上皿天平的基本構造 無法寫出 能正確寫出1項 能正確寫出2項 能正確寫出3項 能正確寫出4項 操作上皿天平測量物體質量 能正確完成1~4項其中0~1項 只能正確完成1~4項其中2項 只能正確完成1~4項其中3項 能正確完成1~4項 能正確完成1~4項,以及第5項
舉例:竹筷桿餾 【評量檢核項目說明】 一、包覆竹筷技巧 (1)樣本排放位置緊密貼合 (2)完整包覆 (3)捏實 (4)留一小洞 (4)留一小洞 二、可燃氣體測試 (1)正確的夾持加熱方式 (2)白煙從小洞口出現 (3)等待白煙完全消失後,才點燃小洞口進行測試 (4)能講出正確的四種氣體產物名稱。 三、液體產物之檢測 (1)有時會用加水方式來方便檢驗 (2)能使用廣用試紙測試,依顏色正確判斷其酸鹼性 (3)能使用石蕊試紙測試,依顏色正確判斷其酸鹼性 (4)能講出正確的液體產物名稱
評量規準(Scoring Rubrics) 表現 項目 1 2 3 4 5 一 包覆竹筷技巧 無法完成 達成一項 達成二項 達成三項 達成評量要求 二 可燃氣體測試 無法達成 未等待白煙出現,立即點燃小洞口進行測試 未等待白煙消失,就點燃小洞口進行測試 等待白煙消失,才點燃小洞口進行測試,但無法完整回答氣體種類 三 液體產物之 檢測
舉例:皂化反應 【評量檢核項目說明】 一、實驗樣本準備 (1)使用電子天平秤重前,先放置秤量紙 (2)能進行電子天平的歸零 (3)能準確完成水15克的稱量 (4)能正確攪拌混合油品 二、手工皂製作流程 (1)能將混合油品加熱,持續攪拌至60℃以上後,離開火源 (2)能正確緩慢加入液鹼後,持續攪拌 (3)能正確緩慢加入水後,持續攪拌 (4)能正確緩慢加入精油後,持續攪拌 三、入模程序 (1)能正確將溶液倒入模中 (2)能使用廣用試紙測試,依顏色正確判斷其酸鹼性 (3)能使用石蕊試紙測試,依顏色正確判斷其酸鹼性 (4)能迅速放入保麗龍箱中,避免失溫
評量規準(Scoring Rubrics) 表現 項目 1 2 3 4 5 一 實驗樣本準備 無法完成 能正確達成一項 能正確達成二項 能正確達成 三項 能正確達成評量要求 二 手工皂製作流程 無法達成 三 入模程序
檔案評量
檔案的意義 Portfolio在字典裡的本義是卷宗、檔案夾或文件夾。 最早被用在藝術家向人介紹他的創作歷程,也經常用於商業上聘用人才的參考。 Portfolio應用在教育強調的是process folio「歷程檔案」。 資料來源:楊忠煌<學生學習歷程系統介紹與教學>
評量的意義 幫助教師 / 家長了解學生學會什麼,還有哪些需要學習。 了解學生的學習好到什麼程度。 反映學校辦學的好壞。 資料來源:張美玉<檔案評量的設計與實施>
檔案蒐集與檔案評量的差異1/3 檔案評量 檔案蒐集 評量目的 有明確的評量目的,主要透過學習檔案,瞭解學生的學習成長。 無明確的評量目的,提供檔案夾讓學生自行擺放資料。 資料來源:涂金堂<是檔案評量或檔案堆積?實施檔案評量時教師應注意的事>
檔案蒐集與檔案評量的差異2/3 檔案評量 檔案蒐集 有系統性的資料蒐集。 照單全收的資料蒐集 有目的性的資料篩選。 沒有進行資料挑選。 資料省思 學習者對於自身學習歷程與結果,進行建設性的省思 缺乏自我省思 資料來源:涂金堂<是檔案評量或檔案堆積?實施檔案評量時教師應注意的事>
檔案蒐集與檔案評量的差異3/3 檔案評量 檔案蒐集 事先提供學習者明確的評分規準。 沒有提供學習者任何的評分規準。 檔案評分 評分者根據評分規準進行評分。 沒有進行評分的工作。 檔案展示 藉由檔案的展示,讓學習者有相互觀摩、評論的機會。 沒有檔案展示的機會。 資料來源:涂金堂<是檔案評量或檔案堆積?實施檔案評量時教師應注意的事>
檔案評量的意義 有計畫和有目的蒐集與組織學生學 習過(歷程)程與成果(作品)表 現資料、努力與進步情形、知識、 技能,與成就證據成一卷宗(資料 檔案夾),以呈現成果(作品)品 質與進步情形。 又稱卷宗評量、歷程檔案評量。 資料來源:方德隆<多元評量的理念與方法>
檔案評量的實施步驟 思考學生的先備條件。 決定檔案評量的目的。 決定評量的內容。 決定評量的方式。 建立評量的基準與規準。 告知受評者應如何做準備。 進行評量。 資料來源:李坤崇<檔案評量理念與實施>、張美玉<檔案評量的設計與實施>
因此,若學生無製作經驗, 先提供結構性檔案範例。學生熟 練後,再提供非結構性的檔案。 思考學生的先備條件 評析學生所需先備知識與技 巧,給予必要的訓練或學習(提 供學生學習鷹架),循序漸進引 領學生成長。 因此,若學生無製作經驗, 先提供結構性檔案範例。學生熟 練後,再提供非結構性的檔案。 資料來源:李坤崇<檔案評量理念與實施>
決定評量的目的 學生努力的程度。 學生進步的程度。 學生學習的困難點。 學生對學習的反思。 教師教學成效。 教師教學策略改進的依據。 資料來源:張美玉<檔案評量的設計與實施>
過程中的樣品或還在進行中 的作品。 成果的樣品。 教師的觀察或評量的資料。 家長的評語。 決定評量的內容1/2 過程中的樣品或還在進行中 的作品。 成果的樣品。 教師的觀察或評量的資料。 家長的評語。 資料來源:張美玉<檔案評量的設計與實施>
決定評量的內容2/2 檔案內容包羅萬象,具體而言有四類: 背景資料(過去各項學習記錄、成績單、心理測驗結果等)。 過程記錄(錄音帶、照片、學生作品、書面成果資料、紙筆作業等)。 反省證據(反省記錄)。 他人的記錄(教師評分等第評量表、家長或同儕的回饋)。 資料來源:李美奇<淺談檔案評量之理念>
決定評量的方式1/3 1.自我評量 ※挑選這個作品的理由是? ※製作這件作品的過程中,是否遭遇什麼困難? ※從完成這件作品的過程中,學到哪些知識或技能? ※從完成這件作品的過程中,你知道自己的優勢與弱勢嗎? ※你對這件作品有不滿意的地方嗎? ※假如給你更多時間完成這件作品,你會有什麼不一樣的作法? ※你對未來的作品,有什麼樣的期許? 資料來源:涂金堂<是檔案評量或檔案堆積?實施檔案評量時教師應注意的事>、張惠珠<國中國文科實施檔案評量之行動研究>
2.同儕互評 ※我覺得○○○很認真,因為 ……。 ※我認為○○○總是願意分享、發表 自己的看法,尤其是在○○○課的時 候,他分享了……。 決定評量的方式2/3 2.同儕互評 ※我覺得○○○很認真,因為 ……。 ※我認為○○○總是願意分享、發表 自己的看法,尤其是在○○○課的時 候,他分享了……。 資料來源:張蔚雯<檔案評量的設計與實施>
3.家長評語 ※依照您的觀察,您的子女本學期 在國文課堂上的努力是……。 4.教師觀察紀錄。 決定評量的方式3/3 3.家長評語 ※依照您的觀察,您的子女本學期 在國文課堂上的努力是……。 4.教師觀察紀錄。 資料來源:張蔚雯<檔案評量的設計與實施>
檔案評量基準、規準設計的考量 兼顧「能力」與「努力」。 資料完整性與周延性。 思考與作品之精密度(學習的深度)。 種類之多樣性(學習的廣度)。 個別項目或整體檔案之表現法或創造法。 知識和技能之成長證據。 在整個期間內,理解力、方法、態度之增進證據。 檔案內所包含項目之品質評鑑結果。 資料來源:李坤崇<檔案評量理念與實施> 張惠珠<國中國文科實施檔案評量之行動研究>
告知受評者應如何做準備 設計檔案使用說明 內容項目。 檔案格式(筆記本、資料簿、光碟片、紙張大小)。 給分方式(評分人員、基準規準)。 明確時間表(完成期限)。 檔案繳交與發回方式。 檔案管理(修改、更新、刪除)方式。 個人風格。 每件樣品都必須標註日期。 資料來源:張蔚雯<檔案評量的設計與實施>、李坤崇<檔案評量理念與實施 >
進行評量 別忘了提供相互觀摩機會的檔案展示。
檔案評量的限制 檢視檔案和回饋所花的時間。 建立信度、效度的困難。 檔案評量本身的真實性。 資料來源:張美玉<檔案評量的設計與實施>
實施檔案評量前,先問自己十個問題1/2 你是否有意願實施檔案評量? 你是否能清楚說出自己為何要採用檔 案評量? 你是否能清楚說出自己為何要採用檔 案評量? 你是否清楚檔案評量的基本概念? 你是否瞭解檔案評量的實施步驟? 你是否清楚知道檔案評量的優缺點? 資料來源:涂金堂<是檔案評量或檔案堆積?實施檔案評量時教師應注意的事>
實施檔案評量前,先問自己十個問題2/2 你是否懂得如何指導學生蒐集檔案評量的 資料? 你是否懂得如何指導學生挑選檔案評量的 資料? 你是否懂得如何指導學生蒐集檔案評量的 資料? 你是否懂得如何指導學生挑選檔案評量的 資料? 你是否有能力教導學生進行自我反思? 你是否有能力設計檔案評量的評分規準? 你是否能客觀的進行檔案評量的評分工作? 資料來源:涂金堂<是檔案評量或檔案堆積?實施檔案評量時教師應注意的事>
參、評量規準設定
國中基本學力測驗成績分析 2012/8/09
誰的考試壓力大? 2012/8/09
免試入學對教學評量的預期影響(教師問卷) 題號 問卷內容 場次 全體 北部 中部 南部 東部 人數 574 193 134 173 66 次數 百分比 9 免試入學方案擴大實施對國中教學正常化有幫助 非常不同意 16 2.79 6 3.11 8 4.62 1 1.52 不同意 81 14.11 28 14.51 18 13.43 27 15.61 7 10.61 沒有意見 131 22.82 39 20.21 35 26.12 40 23.12 24.24 同意 283 49.3 100 51.81 67 50 76 43.93 37 56.06 非常同意 8.71 8.29 12 8.96 17 9.83 4 6.06 10 免試入學方案擴大實施將影響我的教學方式 13 2.26 2 1.04 3 2.24 5 2.89 3.03 113 19.69 42 21.76 12.69 31 17.92 21 31.82 142 24.74 29.85 49 28.32 19.7 237 41.29 85 44.04 58 43.28 38.73 26 39.39 11.5 23 11.92 11.94 12.14 11 免試入學方案擴大實施可以降低校內考試頻率 59 10.28 8.81 6.72 24 13.87 12.12 230 40.07 90 46.63 55 41.04 57 32.95 25 37.88 154 26.83 41 21.24 45 33.58 54 31.21 14 21.21 104 18.12 36 18.65 15.67 29 16.76 4.18 4.15 2.99 5.2 2012/8/09
99&98年不同基測總分PR值考生補習天數分析表 沒有補習 補習一天 補習兩天 補習三天 補習四天 補習五天以上 99年 98年 PR95以上 人數 150 240 70 110 161 271 80 158 65 98 87 159 比例 24.5% 23.2% 11.4% 10.6% 26.3% 26.2% 13.1% 15.3% 9.5% 14.2% PR90-94 83 141 37 74 95 202 73 142 41 117 86 151 20.0% 17.0% 8.9% 22.9% 24.4% 17.6% 17.2% 9.9% 14.1% 20.7% 18.3% PR80-89 130 205 48 75 165 257 118 193 103 189 200 291 16.9% 6.3% 6.2% 21.6% 21.2% 15.4% 16.0% 13.5% 15.6% 24.0% PR70-79 187 24 50 213 91 94 196 188 367 16.1% 3.9% 4.3% 19.3% 14.9% 13.0% 16.8% 30.8% 31.5% PR60-69 112 201 29 46 109 82 128 72 203 183 353 19.1% 17.7% 4.9% 4.0% 18.6% 18.0% 14.0% 11.3% 12.3% 17.9% 31.2% 31.1% PR50-59 119 207 12 192 107 149 191 303 22.0% 2.2% 4.1% 15.1% 19.2% 12.0% 10.7% 35.2% 30.3% PR40-49 126 227 14 22 81 143 102 125 258 25.9% 2.9% 2.5% 16.3% 10.0% 11.6% 14.6% 14.3% 29.5% 29.4% 不到PR40 484 1042 23 57 162 338 186 248 230 385 43.3% 46.2% 2.1% 14.5% 15.0% 9.8% 8.2% 11.0% 20.6% 17.1% 99年問卷收集考生人數為5659;98年問卷收集考生人數為10446人。 2012/8/09
以標準參照評量帶動考試和評量的變革 降低入學考試的重要性和風險性 以標準為核心,帶動學校評量和外部考試的變革 以評量變革帶動教育(教學)的改革 2012/8/09
課程綱要 能力指標 教學 課程/教材 評量 評量標準 補救強化 (診斷) 教學回饋 (班級評量) 學力檢定 (會考) 2012/8/09 183
何謂基準與規準 基準:評分關切的能力。 規準: 1.評分的等第。 2.針對不同等第作品的文字描述(至少3層,具有連續性)。
基準與規準 基準(criteria):能否辨認小雞的叫聲並模仿小雞的運動方式。 評量規準 (rubric) 兒童姓名 3分 能辨認小雞的叫聲並模仿小雞的運動方式。 2分 只能辨認小雞的叫聲,或只會模仿小雞的運動方式。 1分 需要幫助才能辨認小雞的叫聲,或模仿小雞的運動方式。 王ㄨㄨ V 張ㄨㄨ
評量的基準與規準原例 想一想,下列這個例子有何問題? 評量規準 (rubric) 兒童姓名 3分 在觀察動物時,是否表現出愛護、尊重動物的態度。 2分 模仿動物動作時,是否能表達該動物的特徵。 1分 能否指出小雞的外型特徵。 王ㄨㄨ V 張ㄨㄨ
最佳例子:基測寫作測驗評分規準 六級分 五級分 四級分 三級分 二級分 一級分 立意取材 能依據題目及主旨選取適當的材料,並能進一步闡述說明,以凸顯文章的主旨。 能依據題目及主旨選取相關材料,並能闡述說明主旨。 能依據題目及主旨選取材料,尚能闡述說明主旨。 嘗試依據題目及主旨選取材料,但選取的材料不甚適切或發展不夠充分。 雖嘗試依據題目及主旨選取材料,但所選取的材料不足或未能加以發展 僅解釋提示;或雖提及文章主題,但無法選取相關材料加以發展。
規準撰寫建議1 參考國民中學學生學習成就評量標準—閱讀能力 規準撰寫建議1 參考國民中學學生學習成就評量標準—閱讀能力 等級 文字描述 A 能深入…… B 能…… C 大致能…… D 僅能做到部分…… E 未達D級
規準撰寫建議2 等級 文字描述 4分 Yes, and more。 做到了XX,而且還有OO。 3分 Yes。做到了XX。 2分 Yes, but。 做到了XX,但是ZZ。 1分 No。沒做到XX。 資料來源:阿簡的生物筆記。
範例1 基準:能運用合適的語彙,表達出觀察體驗與感覺。 範例1 基準:能運用合適的語彙,表達出觀察體驗與感覺。 評量規準 分數 能清楚說出自己想法,且表達有深度。 5 能清楚說出自己想法。 4 能大致清楚說出自己想法。 3 能說出自己想法,但表達不清楚。 2 完全說不出自己想法。 1 資料來源:董蕙萍<多元評量設計實務>
範例2 基準:認識顯微鏡的構造。 評量規準 分數 能認識目鏡、物鏡等,並知道放大倍率的計算方式 4-5 認識目鏡、物鏡的倍率,但不了解放大倍率如何計算。 3 認識目鏡和物鏡,但不知道如何看目鏡物鏡的倍率,亦不知如何計算 2 完全不認識目鏡和物鏡,也不知道倍率,亦不知道如何計算 1 資料來源:阿簡的生物筆記
範例3 基準:具備數學知識。 評量規準 分數 對於數學問題、概念與原則,顯示深層的理解;使用適當的數學用語,且所有計算皆正確。 5 對於數學問題、概念與原則,顯示不錯的理解;大部分使用適當的數學用語,且很少有計算錯誤。 4 對於數學問題、概念與原則,使用某些錯誤的數學用語,且包含某些計算錯誤。 3 解數學問題時出現許多錯誤;使用許多錯誤的數學用語。 2 解數學問題時出現許多錯誤,對於數學問題、概念與原則,顯示無法理解。 1 資料來源:涂金堂<是檔案評量或檔案堆積?實施檔案評量時教師應注意的事>
範例4 基準:3-4-1-5 能口齒清晰、聲音響亮、 當眾發表意見,並注重言談禮貌。 評量規準 分數 能當眾發表意見,而且口齒清晰、聲音響亮、注重言談禮貌。 4 能當眾發表意見,口齒清晰、聲音響亮、注重言談禮貌三者達成一項以上。 3 能當眾發表意見,但無法口齒清晰、聲音響亮、重視言談禮貌。 2 老師引導後,能當眾發表意見。 1
國中生物科評量標準 能合理延伸1 能熟悉2 能知道 僅能部分知道 學生在學習課程之後能夠到達什麼程度的表現,並給與相對應的描述 說明實驗的編寫、顯微鏡實驗 表現標準反應出現場學生表現的樣態 訂出自然與生活科技學習領域的概念、知識、能力等元素 -- 強調廣度 運用不同的動詞或副詞 -- 強調深度 將內容標準的學習內容對應表現等級所撰寫的描述 學生在學習課程之後能夠到達什麼程度的表現,並給與相對應的描述 表現標準描述的內容:通過該等級的門檻 A等級表現標準:A等級最低門檻的表現 B等級表現標準:B等級最低門檻的表現 推論、比較、解釋、應用、分析 194
表現標準 表現標準反應出現場學生表現的樣態 訂出自然與生活科技學習領域的概念、知識、能力等元素 -- 強調廣度 運用不同的動詞或副詞 -- 強調廣度 運用不同的動詞或副詞 -- 強調深度
表現等級 分五級的原因 配合國內現行的教學評量:五等第在台灣教學現場實施已久,讓國中端及高中職端對學生畢業表現概況的了解 彈性多元整合功能:考量未來用途,可因應彈性合併成適當的呈現方式 通過部分,為避免天花板效應與鼓勵學生精益求精,因此區分為三等級;未通過部分,為合理與適當地分配補救教學資源,針對其落後程度的差異區分兩級
表現描述 將內容標準的學習內容對應表現等級所撰寫的描述 表現標準描述的內容:通過該等級的門檻 A等級表現標準:A等級最低門檻的表現 學生在學習課程之後能夠到達什麼程度的表現,並給與相對應的描述 表現標準描述的內容:通過該等級的門檻 A等級表現標準:A等級最低門檻的表現 B等級表現標準:B等級最低門檻的表現
評量標準架構
怎麼使用評量標準(1/2) 表現標準的描述不是針對作業/考卷的設計,而是學生的能力/程度。 題目不等於難度或表現等級 單一的評量方式通常無法準確判斷學生是否達到A或B等級的表現,常須透過多次評量及多元評量。 針對欲測量的能力所設計的作業/試卷須避免受到其他能力的干擾 僅就所欲測量的能力進行評閱,排除其他能力表現(若非該次作業或試卷所欲評量的能力)的干擾。
怎麼使用評量標準(2/2) 單一主題涵蓋的能力無法藉著單一份作業或試卷測出 並非每份作業/試卷皆能把學生分成五個等級 一份作業/試卷全對不代表一定達到A等級,須根據作業/試卷的類型判斷所能偵測到的能力表現 單憑一份作業/試卷不足以準確判斷學生能力等級 就同一份作業/試卷而言,甲學生的作答反應可以反映其表現等級/能力,但可能無法從乙學生的作答反應判斷其等級/能力
『評量』應該是一個增加學生學習信心、強化學生學習動力、以及慶祝學生學有所成的『機會』。
多元評量,從小做起 設計高層次認知題型於教學及評量。 呈現客製化的質性評語於評量成果。 活用自評、互評、家長評語等方式。 加入口說及聆聽能力於教學及評量。 利用一次段考期間,實施檔案評量。 規劃一個專題報告(一學年一次)。
蹩腳講課十要件 準備欠周全 浪費大家的時間 自言自語,無視於觀眾的存在 畏首畏尾,言詞吞吐 表達的是意見而非事實 偏離主題 忘了講課的目的何在 不熟悉現場器材設備的使用方法 時間控制不當 結論含糊,不知所云
教學十不 不要說不來上課沒有關係 不要針對個別學生開玩笑 不要把學生與自己相比 不要在壓力下更改成績 不要對學生灰心而輕言放棄 不要造成學生有性搔擾的誤會 不要使學生分數分佈太狹窄 不要隨便更改評量標準 不要在課堂上批評行政或其他老師 不要羞於承認缺失或錯誤
教學十要 要說明如何有系統的學習本課程 要及早規劃內容、公佈評分標準 要保持明快、可親、認真、無私的形象 要多鼓勵、少責備 要經常提示本課程與其他課程之關聯性 要明白宣告誠實之要求 要主動向其他老師求救 要尊重學生尊嚴 要有教學熱忱及耐心 要講求原則,公平合理
國軍菜鳥軍人讀訓 第一條:菜鳥自覺,認清輩份,不得有故作大條,一臉欠揍之行為。 第二條:衛哨輪值,上早下遲,不得有準時換哨,累壞老鳥之行為。 第三條:放假採買,靠邊涼快,不得有爭先恐後,妨礙老鳥之行為。 第四條:公差勤務,自動出列,不得有畏縮不前,東躲西藏之行為。 第五條:有煙快上,有火快打,不得有延誤推諉,一臉不悅之行為。 第六條:老鳥摸魚,自動掩護,不得有打小報告,故意抓包之行為。 第七條:刻苦耐勞,咬緊牙關,不得有畏苦怕難,連累老鳥之行為。 第八條:挑磚撿大,挾肉選小,不得有吃飽喝足,老鳥挨餓之行為。 第九條:表現平平,減少曝光,不得有凸顯鋒頭,矮化老鳥之行為。 第十條:天氣炎熱,速送冷飲,不得有口袋空空,照顧不週之行為。
教師的十項基本能力 一表人才→內涵 二套西裝→外表 三杯酒量→酵素 四圈麻將→媒介 五方交遊→資源 六出祈山→精神 七術打馬→讚美 八口吹牛→策略 九分努力→基石 十分忍耐→修為
不做,不會怎樣 做了,很不一樣 多元評量的迷思概念 多元評量並非廢除紙筆測驗 多元評量並非一種評量方式 多元評量並非學習終點 多元評量並非主觀評量 多元評量並非萬靈丹 多元評量不是為多元而多元 不做,不會怎樣 做了,很不一樣
我們有責任 不讓學習低成就的孩子 成為教室裡的客人 ☆最有機會圓滿他人生命 的職業--老師 我們有責任 不讓學習低成就的孩子 成為教室裡的客人 ☆最有機會圓滿他人生命 的職業--老師 臺灣師大 陳慧娟(2011)
愛爾蘭詩人葉慈說: 教育不是注滿一桶水, 而是點燃一把火。 今天的學習不是只為現在,還要為未來做準備。 教師的角色在啟發學生,有計畫在教學過程 製造真實深刻的遷移經驗,幫助學習者體驗 學以致用的奧妙。 <愛爾蘭詩人 葉慈>
212 優質教學 提升學生學習力 厚植國家競爭力 簡報結束,感謝聆聽
錯字
少寫一個字 真的差很多~~
國文老師都嘛困難化.....
接續:我打開窗簾 看到了朝陽 你的國文老師所想的:他想到了辦法突破了困難 改變了自己的生活 作者想表達的:廢話!!都早上了幹嘛不開窗簾
【女考生霸氣姓名讓人無法直視 】有網友在高考考場上留下的考生姓名紙條上,發現了如此霸氣的名字。 「是」這個姓,屬罕見姓,主要分佈於江蘇常州無錫江陰宜興等地。
我的愛情路
風中殘燭
這小子很有前途................用文言文敘述 打躲避球
孩子啊!你的「手」勾錯邊了
哈!!!我鐵支了........
杜甫確實很忙
終於找到了一個適合自己身材的形容詞——肥而不膩....
承諾就像放屁, 當時驚天動地,過後蒼白無力。
有些人就像一片雲
當你第一次給喜歡的女生發短信時,就是這個感覺
小明...你真是太有天份了
【】
【】 考試的五個階段
下課前永遠都沒問題
這個圖書館管理員太有才了!
睡覺得人生
下次考試不會寫可以試試
暗黑破壞神.連請假理由都有跟上潮流啊
早上起床有這種情況的童鞋請自覺舉手...
交往久了之後的差別
沒做的事情會被罰嗎
期中考最慘的悲劇
"為你寫詩" 有點久的歌 為你寫詩 為你靜止 為你做不可能的事 為你我學會彈琴寫詞 為你失去理智
老師 小朋友真的很天真
看圖猜成語
鴉雀無聲 解答 解答 杯弓蛇影
解答 愚公移山 解答 比手畫腳
一知半解 解答 解答 指鹿為馬
解答 一手遮天 解答 以卵擊石
力不從心 解答 解答 提心吊膽
解答 接二連三 解答 精打細算
話中有話 順手牽羊 解答 解答
舉一反三 解答 解答 錦上添花
守口如瓶 解答 解答 過河拆橋
口是心非 解答 解答 驚弓之鳥
袖手旁觀 解答 解答 過門不入
見錢眼開 解答 解答 海裡撈針
解答 胸有成竹 解答 掩耳盜鈴
解答 四腳朝天 解答 七上八下
殺雞取卵 解答 解答 四面楚歌
解答 三心二意 解答 坐井觀天
舉棋不定 解答 解答 石沉大海
解答 針鋒相對 解答 九牛二虎