Download presentation
Presentation is loading. Please wait.
1
從試題分析談 數學科有效教學策略 左太政 / 國立高雄師範大學數學系
2
從國中小數學段考 試題談起
3
據媒體報導有關國中數學試題: 已知正方形邊長為1,試求圖形EFMN的面積。
4
參考解法:作補助線 評量重點:理解圖形面積公式的應用
5
媒體報導某校國小六年級段考題 已知ABCD是一個長4公尺,寬2公尺的長方形,以B為圓心,為半徑畫一扇形ABE,以D為圓心,為半徑畫一扇形ADF,試求塗色部分面積。
6
作補助線如下:
7
國小六年級段考題 在圓中畫一最大正方形(如圖示),正方形的面積是50平方公分,求圓面積。
8
參考解答 設圓的半徑為 ,則正方形的面積是 。 所以圓的面積為
9
如果有一份數學科測驗題目,述明命題理念、評量範圍、評量時間、能力指標,甚至於自編雙向細目表、難易度,是否足夠評斷一份優良試題?
10
評判一份優良試題 除上述必要資料外,尚須做到: 雙向細目表的安排是否具有專家效度? 是否作試題分析?
11
測驗的概念 測驗的概念始於測量, 目的主要是在了解個體在某一項心理特質(例如:數學能力等)上的狀況。
做法是設計一些能夠測量出該項特質的題目讓受試者去回答,經由受試者的答題反應來估計他在該項特質上的程度,並給予分數描述之。
12
測驗編製流程 決定測驗目標 建立雙向細目表 決定題目的評量目標 選擇適當題型 設計題目 題目修整與審查 預試 試題分析 建立題庫
13
一、如何決定測驗目標
14
題目難度與題數要依測驗目的作適當的分布 1.在題數有限的條件下,為了降低測量的誤差,題目的難度就必須依據測驗的目的作適當的分布。
2.如果測驗的目的是要篩選資優生,則高難度的題目數量就要增加,如此才能增加高能力受試者的測量精確度。 3.如果測驗的目的是要對廣大的母群體作測量,則題目難度應該分布廣泛些,並且可以稍微多一些中等難度的題目。
15
容易的題目 困難的題目 上圖表示良好測量的受試者反應模式 (+表示答對,-表示答錯)
16
無法了解受試者能力 - + - - - + - + + - + 容易的題目 困難的題目
容易的題目 困難的題目 上圖表示測量失敗的受試者反應模式(+表示答對,-表示答錯)
17
受試者的反應也應當是可以被預測的 如果受試者能夠答對高難度的題目(或對較高程度的題目回答出正向反應),我們會預期他應該有能夠答對簡單的題目(或對低程度的題目回答出正向反應),此時我們才能給予分數。 如果受試者的反應並不如預期,他答對了高難度的題目,卻反而答錯了簡單的題目,此時表示測量失敗,我們應當重新去檢討測驗題目的設計是否有問題,並去了解受試者是否有亂作答的情形。
18
二、如何編制雙向細目表
19
教 學 目 標 教學目標一 教學目標二 教學目標三 教學目標四 學習內容 學習內容一 評量目標一 評量目標二 評量目標三 學習內容二 學習內容三
20
民國 年第 次國中基本學力測驗 認 知 層 次 概念理解 程序執行 解題與思考 測驗內容 數與量 圖形與空間 統計與機率 代數 *認知歷程與測驗內容皆是採用國中基本學力測驗所公布之雙向細目表 *測驗內容在基測網站有多一項「連結」內容,但其給命題老師之雙向細目表中則無。
21
NAEP(1999)在1996年所進行的數學科評量中,將數學能力分為:
概念的瞭解 程序性的知識 解題
22
概念的瞭解 對於概念符號的正反例能加以辨識 能利用模型、圖形及符號來表示概念 辨識和應用原理原則 知道和應用事實與定義
能整合相關概念和原理原則,擴充原本的概念和原理原則 能辨識和應用符號表示概念 能詮釋概念間相關結論與關係
23
程序性的知識 正確地選擇和應用程序 能對程序的運用加以說明及判斷其正確性 擴充或修正程序,以處理問題中原有的因素
24
解題 在新的情境中能使用數學知識 能確認及明確地陳述問題 能運用策略、數據、模型及相關的數學 能創造與使用程序並予以發展和修正
能判斷解答的正確性與合理性
25
認知領域— 指心智方面的能力,依 Bloom (1956) 的分法,認知領域包括下列六個層次: 記憶 理解 應用 分析 綜合 評鑑
26
Bloom (2001)修正認知領域-(呈現於雙向細目表)
記憶 理解 應用 分析 評鑑 創造
27
三、決定題目的目標 (一)題目的目標是由教學目標與學習內容結合成的具體項目,也就是雙向細目表中細格內的評量目標。
(二)每個題目都應該有它所欲評量到的目標,題目就是依據這個評量目標來設計的。如表一中細格內所示。 (三)以編製數學科的成就測驗為例,我們可以根據Bloom(1956)對認知領域能力的分類(包含知識、理解、應用、分析、綜合、評鑑等)來建立教學目標橫軸;再根據數學科的學習內容(包含線性代數、幾何、機率與統計等)建立縱軸。再根據兩軸所交集成的細格來建立評量目標。
28
四、選擇適當題型
29
五、設計題目 1.選擇適合的題材與題型: 2.設計題幹(與選項): 3.說明理念、答案與理由: 4.檢查題目是否符合命題原則:
30
國中數學科測驗命題原則 一般注意事項 1.試題的表達方式要能切合該題的評量目標。 2.試題要能清楚的表達題意。
3.每個試題只問一個問題,避免同時包含太多概 念。 4.試題的文字敘述應簡潔、明白,避免出現跟答案無關的內容。 5.標點符號的使用要準確。 6.試題的文字敘述應加以變化,避免直接抄襲課文。 7.試題宜與學生的生活經驗相結合。
31
題幹與選項的設計原則 1.題幹與選項的文法要一致,邏輯上要能連貫。 2.題幹或選項中,應避免出現可能暗示正確答案的線索。
3.題幹應儘量用正面的敘述,避免使用否定句。若用否定句時,請在否定字眼下加註雙底線。 4.題幹的敘述應保持完整,避免被選項分割成兩個部份或段落。 5.各選項中重複出現的文字請放在題幹內。 6.每個選項應使用相似的表達方式。
32
7.選項中只有一個最佳或正確答案。 8.錯誤選項應具有誘答力。 9.錯誤選項要能有充分的理由,足以說明其不正確。 10.應儘量避免「以上皆是」或「以上皆非」的選項。 11.選項應相互獨立,彼此之間沒有邏輯上的關聯(相互依賴、相反)。 12.選項中應避免出現絕對性的字眼。
33
公平性 1.試題中應避免歧視性別或種族的字眼。 2.試題中的訊息不宜是某些群體(種族、性別、居住地區)所特別熟悉。 3.考生答對試題的機會,不應受到該題學力指標以外的因素所影響。
34
原創性 1.試題不應在課本、參考書或補習班講義中出現過。 2.試題不應在任何考試中出現過(包括歷屆聯考、推薦甄試、學校考試或其他大型考試)。
35
六、題目修整與審查 由於一個人所能顧及到的層面有限,許多重要的測驗通常會有修題與審題者。主要是邀請在該學科上比較有經驗的專家以及測驗專家來擔任,用不同的觀點來檢查與修飾題目,讓題目的評量功能能夠更完善。 修(審)題通常會從「題目是否符合命題原則」、「題目會不會對不同族群或不同地區者造成不公平的現象」,以及「題目的格式是否有統一」…等幾個層面來考量。
36
七、預試 (一)當題目設計出來後,即使經過了「質」的修飾,也難免還會有些疏漏之處。因此需要實地去進行試測,蒐集試題在統計方面的特性,並以此來篩選或進一步修改不恰當的試題。 (二)預試的過程是在目標群體中抽樣,選取一些具有代表性的樣本,然後使用試題對這些樣本進行施測,再用蒐集回來的受試者反應資料進行試題分析。 (三)為了考慮到測驗的公平性,整個預試過程應該要對試題作完善的保密措施,避免非受試樣本以外的任何人接觸到試題。
37
八、試題分析 試題分析編製測驗的一項重要步驟,它是試題篩選與修改的重要指標。 一般可分為: (1)古典測驗理論的試題特徵分析
(2)試題反應理論(Item Response Theory)的試題特徵分析。
38
古典測驗理論的試題特徵分析 包括試題的答對率(P)、鑑別度、各個選項的誘答力,以及測驗的整體信度等。
39
試題反應理論的試題特徵分析 包含試題的鑑別度(a參數)、難度(b參數)、猜對率(c參數)、以及整體測驗的訊息量等。
40
試題質的分析 一、每道試題是否均能測量到雙向細目表中的每一項重要學習結果? 二、試題的類型是否適合於所要測量的學習結果?
三、試題的敘述是否明確,是否遺漏了重要的條件? 四、應使用簡單且清晰的用語來陳述。 五、試題應避免提供額外之線索。 六、試題是否難易適中? 七、每道試題是否彼此獨立、未採用連鎖題? 八、測驗所包括的試題,是否能夠涵蓋整個雙向細目表的內容?
41
試題量的分析
42
試題分析的方法 難度與鑑別度 測驗實施完畢並評定答案的總分後,即可進行試題的難度鑑別度之分析。分析步驟依下列方式進行:
43
試題分析的方法 1.依據試卷總分的高低依序排列;
2.從最高分部份向下取總人數的27%為高分組,再從最低分部份向上取總人數的27%為低分組。亦可以前50%和後50%來區分高分組、低分組; 3.分別計算高分組及低分組在每一道試題的答對人數與百分比; 4.根據下列公式來計算每題的難度指數;
44
難度分析的主要目的在確認每題的難度,最簡單的分析方式是計算全體受試者每題答對人數的百分比,其公式為:
難度指數,其中 表示答對的人數, 表示總人數。 測驗的全部試題宜接近0.50的平均難度。
45
試題難易度等級表 難易度 難易度等級 極容易 容易 難易適中 困難 極困難
46
難易度的另一公式
47
檢查每題所列選項的答題人數,已確認誘答度
48
鑑別度 根據下列公式來計算每題的鑑別度指數; 鑑別度指數值介於-1.00到1.00 之間,指數愈高,表示鑑別度愈大;
指數愈低,表示鑑別度愈小。 鑑別指數 試題評鑑 0.40 以上 非常優良 優良,但可能需修改 尚可,但通常需修改 0.19 以下 劣,需淘汰或修改
49
測驗的要素: 要成為一份良好的測驗,必須具備測驗的幾個要素。
信度 效度 常模 實用性
50
信度與效度分析
51
信度指測驗分數的穩定性與可靠性。常見信度如下:
再測信度 是計算同一群體,用同一份測驗進行兩次施測其分數的相關係數。這是為了了解測驗分數的穩定性或測驗時間取樣的誤差。
52
折半信度 是將一份測驗拆成對等的兩半,計算這兩半總分之間的相關係數。這是為了了解測驗的一致性或內容取樣的誤差。
53
信度:內部一致性法 是直接計算測驗的內部一致性係數,常見的有庫李法與Cronbach(1951)係數,這是為了了解測驗的內容一致性。
(1)庫德(Kuder)與李查遜( Richardson)於1937年提出分析題目之間一致性的方法,簡稱庫李法。該方法適用於一個測驗僅施測一次,同時適用於答對一題的1分,答錯1題得0分的題目。 (2)Cronbach(1951)所設計的係數,適用於多重計分的測驗或量表
54
信度(繼續) 一般而言,測驗的信度愈高,代表此測驗所測得的分數愈穩定或愈可靠。通常良好的測驗信度係數應該要到達0.9以上。不過也需要考慮到所測量的特質其所包含內容的一致性,以及測驗的題數。
55
效度 指測驗能夠測量到它所欲測量之特質的程度,或指測驗能達到其目的的程度。
56
內容效度 指測驗的試題,能測量所欲測量內容的程度,適用於有固定命題範圍的成就測驗
57
內容效度 其步驟如下: 確定所要測量的範圍及教學目標; 建立雙向細目表(教材內容與教學目標二向度); 請數名專家學者評量該表是否適當;
評量結果一致性高,即表示該測驗具有高的內容效度。
58
專家效度 大約邀請10位專家學者對問題內容表示是否適當。
59
常模 (Norm) 是指某特定團體在某一測驗上之得分的平均數,即根據標準化樣本施測結果,將所有受試者的分數,經統計分析,整理出一個系統性分數分配表,按高低排列,所得平均數。 個人在測驗上所得的分數稱為原始總分,須經常模的對照,將原始分數轉化為衍生分數才具意義。 具體而言,它有兩個功能,第一是了解個人分數在團體中的地位,第二是比較個人多個特質所代表的意義。因此,常模是解釋測驗分數的參照依據。
60
實用性 包括易於取得所需的測驗、施測的方便性、易於計分與解釋、難易適中、鑑別度佳、客觀公平等,如此才是一份可使用性高的測驗。
61
標準化的三個層面 測驗發展程序的標準化 這是指測驗發展的過程需要依據標準的測驗編製程序來進行,包括決定測驗目標、擬定雙向細目表、設計與修審試題、抽樣與預試、分析試題以及建立測驗的信度與效度等。
62
標準化 施測過程的標準化,這是指測驗要有固定而且明確的指導語以及施測程序,使每個受試者都能在相同的條件與情境之下進行測驗。
63
標準化 測驗計分、使用與解釋的標準化,是指分數的計算方法與結果的解釋原則,應該要遵循一定的要領與方法。
測驗標準化的主要目的是為了使測驗能有較好的測量品質,降低測量的誤差,增加測驗分數的客觀性與正確性。
64
九、建立題庫 基於測驗效率的考量,有些經常要使用的測驗會將設計良好、而且「質」與「量」的特性都完善的題目建立成題庫,以供正式測驗時使用。
題庫中應當具備所有關於試題的各項訊息,包括每個題目所評量的目標、題目的本體、答案、出處、設計者、難度、鑑別度…等。以提供未來組成正式測驗時使用。
65
學生數學學習成就的主要 國際評比 國際數理學科學習成果評量(Trends in International Mathematics and Science Study,簡稱TIMSS) 學生基礎素養國際研究計畫(Program For International Student Assessment,簡稱PISA)
66
TIMSS2007國際數學與科學教育成就趨勢調查的結果可作為我國數學與科學教育研究與實施之參考。
了解我國學生數學及科學學習成就,提供規劃我國中小學的數學及科學課程之參考。 了解我國學生數學及科學學習成就與家庭背景、學習環境、教師因素等影響因子的關係,並進一步作國際比較分析。 與TIMSS-R及TIMSS2003之結果作比較,了解我國學生在數學及科學學習成就之趨勢。 了解國際上評量學生學習成就的趨勢與新的評量方法,提供我國教師參考。 提昇國內研究人員資料分析研究能力。
67
2006PISA 數學素養測驗近日公布成績 台灣數學PISA拿第一 學者:高分多、低分群也多
PISA (Programme International Students Assessment )
68
PISA是「學生基礎素養國際研究計畫」(Programe for International Student Assessment)的簡稱,由OECD經合發展組織從二○○○年開始舉辦,每三年施測一次。
此次有五十七國參與,測量數學、科學、閱讀等三科素養;題目偏重情境化、貼近生活。
69
台灣抽測兩百四十所學校、八千多名學生,包括國中、五專、高中、高職、補校生。每校受測學生會被分配到十三種不同的題本,三科共考兩個小時。
70
2006年PISA排名,台灣在數學奪得第一名,芬蘭居次,韓國、香港並列第三;是台灣歷年來參加國際數學評比,成績最好的一次。
過去的國際評比都能發現,台灣學生數學能力非常好,但這只是前百分之十二的頂尖學生。事實上,還有百分之十二的學生成績落在後端。此外,這次測驗的題目以科學為主,數學題目並不多。
71
PISA是甚麼? 一項對十五歲學童進行的國際評估,以測試他們對知識與技能的掌握
這項由經濟合作與發展組織﹝Organization for Economic Co-operation and Development, 以下簡稱OECD﹞策劃的學生能力國際評估計劃﹝Programme for International Student Assessment, 以下簡稱PISA﹞,目的在評估接近完成基礎教育的十五歲學生,是否能夠掌握參與社會所需的知識與技能。
72
PISA對數學素養的界定 數學素養是一種個人能力,學生能確定並理解數學在社會所起的作用,得出有充分根據的數學判斷和能夠有效的運用數學。
這是作為一個有創新精神、關心他人和有思想的公民,適應當前及未來生活所必須的數學能力。
73
進一步的闡述和說明 “社會”。它包括自然、社會、個體生活的文化背景。
“從事”。它並不僅僅指狹義上的身體的或社會的行為,而是包括傳遞、聯繫、評價甚至欣賞陶醉於數學知識。 “當前及將來的生活”。它包含有個體的私人生活、職業生活,與朋友、親友的社會生活,以及作為社區公民的生活。
74
數學素養測評的內容 四個領域即數學技能、主要的數學概念、數學課程因素、數學情境中展開。
數學技能和主要的數學概念為主要領域,涉及評價的範圍和熟練程度;數學課程因素和數學情境則是次要領域。
75
數學技能:指數學的綜合能力 數學的思考能力; 進行數學論證的能力; 建立模型的技能; 提出問題並解決問題的能力; 表示的能力;
使用符號、形式和技術能力; 交流觀點的能力; 使用各種工具、輔助物的能力。
76
主要的數學概念 PISA中的主要的數學概念應是包含有足夠多的類型和深度來揭示數學的本質。
77
數學課程因素 PISA的測評重點雖不完全來源於傳統的數學課程,但是PISA仍將傳統的數學課程內容作為數學素養評估的一小部分,
這部分內容主要包含有數位、測量、估計、代數學、函數、幾何學、概率、統計學、離散數學等。 PISA設計題目來評價這些內容,並確保其題目與學校數學課程相關題型的分佈的均衡。
78
數學情境 PISA強調在各種不同的情境中解答數學問題,運用數學知識。 PISA認為數學方法的選擇、結果的表示經常取決於問題顯現的情境。
79
數學技能分為三個能力等級 能力等級一:定義、計算。
這一等級包括的知識有事例、表示、確定等式、思考數學物件和數學性質、操作程式、運用標準演算法和發展專業技能等。 它要求學生能運用多種不同方法表達標準的符號、法則,要求學生學會計算。
80
能力等級二:為解決問題而建立聯繫。 在這一等級裏,要求學生根據不同情境和目標,學會使用不同的表示方法,同時要求學生學會區別或聯繫不同的陳述,如定義、判斷、例子、有條件的判斷和證據等。 它要求學生為解決簡單的問題,懂得選擇使用什麼數學方法、數學工具,對不同材料、領域進行聯繫,對各種資訊進行整合。
81
能力等級三:數學思維和概括的能力。 要求學生將現實問題數學化,即辨別並提取包含在情境中的數學因素,並運用數學知識解決問題,分析、解釋他個人的數學模式,提出有根據的數學觀點、論據並予以概括。 同時,在問題的情境中反思解決的方法,它包含對模型的分析和對方法的思考,不僅要求學生學會解決問題,而且要求學生學會提出問題。
82
範例說明
83
問題1-3蘋果 一個農夫按照正方形的規律種植蘋果樹。為了保護果樹免受強風侵襲,他在果園的周圍栽種了針葉樹。
下面是栽種情況的示意圖,根據蘋果樹的行數(n),你可以看到蘋果樹和針葉數的種植規律。
84
請完成下表:
85
問題2:蘋果 你可以用以下兩條公式,計算出上述方式所種植的蘋果樹和針葉數的棵樹: 蘋果樹的棵樹= 針葉樹的棵樹= n是蘋果樹的行數。
若n等於某個數值時,蘋果樹的棵數與針葉樹的棵數便會相等。現試求出這個n的數值,並說明計算方法。
86
問題3:蘋果 假設這個農夫要建一個更大、可以種植更多果樹的果園。當他擴建果園時,哪一種樹的棵數會增加的較快?請解釋你是如何找到答案的。
88
問題 4: 陸地的面積 試運用地圖的比例尺,估計出南極洲的面積,並列出和說明估計方法。 (若有需要,可以在地圖上表示出你的估計方法)
90
問題5-8 賽車速度
91
問題5: 賽車速度 從起跑點到跑道上最常直線路段的起始大概距離多少? 0.5千米 1.5千米 2.3千米 2.6千米
92
問題6:賽車速度 根據記錄,第二圈最低車速是在那個地方? A 起點線 B 大約0.8千米 C 大約1.3千米 D 在跑道的半路
93
問題7:賽車速度 你如何形容賽車在2.6千米和2.8千米之間的速度情況? A 賽車維持均速 B 賽車在加速 C 賽車在減速
D 不能夠從圖中看出賽車的速度。
94
問題8: 賽車速度 下面有5張不同的跑道圖。哪幅圖是該輛賽車行駛的賽道?
95
問題16: 彩色糖果 小華的母親讓他在一個袋中抽取一顆糖果。他不可以看糖果。下圖顯示了袋中每種顏色的糖果的數目。
問題16: 彩色糖果 小華的母親讓他在一個袋中抽取一顆糖果。他不可以看糖果。下圖顯示了袋中每種顏色的糖果的數目。 小華抽中一顆紅色糖果的概率是多少呢? 10% 20% 25% 50%
96
問題19:垃圾 一班學生為一份有關環境課題的習作。收集了幾種人們丟棄的垃圾之分解時間資料: 一名學生打算以長條圖來表示上述的資料。
試寫出一個原因解釋為什麼棒形圖不是用於表示上述資料。
97
問題 27 : 數字立方體
98
問題29-30最佳汽車 一本汽車雜誌運用一套計分方法來評價新推出的汽車,從而選出總分最高的汽車為「全年最佳汽車」。現有五輛新車被評選,下表列有它們的得分。 3分 = 極佳 2分 = 良好 1分 = 普通
99
問題29:最佳汽車 這本汽車雜誌運用下列公式(個別得分的加權總和),來計算每輛汽車的總分: 總分 = (3 × S)+ F + E + T
請計算汽車「Ca」的總分,並把答案寫在下面: 「Ca」的總分:_________
100
問題30:最佳汽車 汽車「Ca」的製造商認為這種計算總分的方法並不公平。 請列寫一條計算總分的方法,以致汽車「Ca」能成為優勝者。
你的算式必須包含全部四個變數,請於下列算式的四個空格上填寫鄭述以表達你的計算方法。 總分 = □ × S + □ × F + □× T
101
問題31: 梯級樣式 小輝用正方形砌成梯級的樣式。以下是他依照的階段。 從上圖可見,在「階段1」,他用一個正方形,「階段2」用三個正方形,
問題31: 梯級樣式 小輝用正方形砌成梯級的樣式。以下是他依照的階段。 從上圖可見,在「階段1」,他用一個正方形,「階段2」用三個正方形, 「階段3」用六個正方形。 在第四階段,他應該用多少個正方形呢?
Similar presentations