學習歷程 陳富美
「學習」的定義 從行為主義的角度來看,學習(learning)意味著行為的改變(建立)──而非通常我們所說的「獲得觀念」、「了解道理」等等。
”學習”兩個大前提 所謂的「學習」,包含兩個要件:(1)行為的改變必須是基於經驗的影響;(2)行為的改變必須是相當持久而穩定的現象 疾病, 腦傷,或藥物影響等生理變化造成的行為改變不屬於此類. 偶一為之的行為也不屬於此類
一定要記住的學者: John Watson 行為主義學派創始人
行為主義學派(Behaviorism)認為: 每個人成為怎樣的人, 基本上決定於他的成長經驗 藉由經驗, 建立自己的行為模式
什麼是“經驗” (講義137) 個人所遭遇到的事情(親身經歷) 個人對於行為所產生結果的感受 個人觀察他人言行而產生的經驗
John Watson(華生)的名言 :(課本p176) 給我一打健康的嬰兒,不論他們的先天才智、賦性、傾向、種族、出身背景為何,我保證可以將他們隨意地培養成,醫生、律師,乃至於乞丐、小偷。
Watson的主要論點(課本p176) 人之所以表現出”某種行為“, 九成九是學來的 人出生時, 除了極少數動作外(如反射動作), 在心理上一無所有 一出生,沒有任何傾向,例如, 不特別乖巧, 也不特別叛逆 人在生長的過程中, 環境一點一滴, 夜以繼日的型塑一個人
我們說一個人”學乖了“ ”學聰明了” , 就是從經驗中學習的例子
行為主義學派的主張 不以心思、意識等為研究對象,研究外顯行為 不用內省法而改用實驗法為主要研究方法。
人與動物的區隔? 一旦將「心思」排除於心理學之外,不承認它們對行為有影響,那麼人與動物的行為便不再有明顯的界線
什麼是“經驗” (講義138) 個人所遭遇到的事情(親身經歷) :古典制約(classical conditioning) 個人對於行為所產生結果的感受:操作制約(operant conditioning) 個人觀察他人言行而產生的經驗: 觀察制約(observational learning)
古典制約:正統條件化 俄國生理學家Ivan Pavlov(巴卜洛夫)發現並深入探討的正統條件化(classical conditioning) 歷程,才是真正重要的學習歷程。
講義139 Pavlov研究唾液在消化歷程中的角色。他假設:唾液分泌是動物口腔對食物刺激的生理反射。
正統條件化 Pavlov 的實驗
古典制約 條件反應的習得(講義140)
條件化歷程應具備之要件 無條件刺激(unconditioned stimulus,US):無需其他條件就能引起特定反應(如流口水)的刺激。 正統條件化 條件化歷程應具備之要件 無條件刺激(unconditioned stimulus,US):無需其他條件就能引起特定反應(如流口水)的刺激。 無條件反應(unconditioned response,UR):由無條件刺激所引發的反應 。
條件刺激(conditioned stimulus,CS):只有在特定條件下,可以引發原先只有US才能引發的反應之中性刺激。 條件反應(conditioned response,CR):由CS所引發的反應,跟UR是同類的,但在強度上稍弱一點。
古典制約 聯結論(課本p185) 有些心理學家喜歡用聯結(association),這個字眼來指稱正統條件化歷程。他們認為,條件化的結果是使得CS與US在受試者腦中發生聯結。 因此,行為主義的學習觀點被稱為聯結論(associationism)。
正統條件學習的三要素 CS與US配對呈現 CS先於US 兩者的時間間隔不能太長 動物學到什麼? CS顯然預告US的來臨
條件反應的消除與自然恢復 (講義 141) 消除程序是CS單獨出現(不再有US伴隨出現)的程序。 正統條件化 條件反應的消除與自然恢復 (講義 141) 消除程序是CS單獨出現(不再有US伴隨出現)的程序。 已被消除的條件反應,在休息一段時間後,會再度出現,只是強度比未消除前弱了一點。這個現象稱為條件反應的自然恢復(spontaneous recovery)。
正統條件化 正統條件化的學習曲線
刺激的類化與辨別 (講義p141) 除了原先的CS外,類似於CS的其他刺激是否也能引發CR 古典制約 刺激的類化與辨別 (講義p141) 除了原先的CS外,類似於CS的其他刺激是否也能引發CR 這種「由類似刺激引發條件反應」的現象,稱為刺激類化(stimulus generalization)
刺激的類化與辨別 刺激的類化與辨別 類化反應也有它的缺點,比如說,「一朝遭蛇咬,十年怕草繩。」便是對蛇的過度類化反應。這種反應雖有助於對蛇類提高警覺,卻也造成不必要的緊張。
刺激的辨別 所謂刺激的辨別(stimulus discrimination),是學習針對不同的刺激(譬如,蛇與草繩)給予不同的反應。
高層制約 當制約刺激(CS)可以單獨引起制約反應(CR),這時制約刺激可以當作非制約刺激(UCS) ,使它與另一個制約刺激配對出現,藉以建立另一個古典制約學習
正統條件化 高層制約
慾求的條件化與嫌惡的條件化(課本193) 當我們使用食物、糖水等作為US時,由於這類刺激是受試者所慾求的,因此,這類的條件化稱為慾求的條件化(appetitive conditioning)。 使用電擊、令人害怕的巨響等作為US的條件化,則稱為嫌惡的條件化(aversive conditioning)
正統條件化 嫌惡的條件化 Watson & Raynor(1920)對未滿周歲的小亞伯進行實驗。每當小白鼠出現,亞伯高興的爬過去時,實驗者就以鐵棒敲出巨響,讓亞伯驚慌害怕。實驗進行沒幾次,小白鼠會引發亞伯的懼怕反應。 甚至對於任何毛絨絨的物品,都會驚慌害怕。
這個實驗有道德上的缺陷,卻為心理學增添了知識,讓我們了解,情緒反應的根源常是條件化經驗。 你可能「沒來由的」討厭某人,事實上,它是「有來由的」——他可能曾與某個嫌惡刺激(aversive stimulus)發生聯結,或與某個討厭的人很像,使你對他產生厭惡的類化反應。
古典制約學習的應用(講義142) 恐懼或焦慮的情緒 愉快情緒的學習 廣告行銷 生理的反應 以古典制約治療不適應行為
生理反應的舉例 對喝過糖精(CS)的老鼠注射抑制免疫力的藥物(US),能讓糖精具有抑制免疫力的功效。 這方面的研究叫心理神經免疫學(psychoneuroimmunology)。
以古典制約治療不適應行為 尿床的行為改變治療 睡在特製的床墊上 尿床後,床就會發出鈴聲(UCS) ,將小孩吵醒 經過幾次連結後,CS就可以喚醒(CR)小孩起床上廁所。
古典制約的特點 CR都是由自主神經系統控制的反應,不是我們所能隨意控制。 學習完全決定於外在條件,只要CS與US適當的配對,就會造成條件化。學習者是被動的,他的反應是由刺激所「引發」的,不是「自發」的。 我們日常生活中大部分的學習卻不是這樣的。
操作制約學習(講義145) 古典制約學習無法解釋許多行為: 例如海豚跳躍表演 心理學家開始研究動物” 解決問題的能力” 先驅性研究:Thorndike的難題箱(puzzle box)實驗。
操作的條件化 (講義143)
Thondike實驗的理論重點(講義144) 學習是嘗試錯誤(trail-and-error)歷程 : 不斷嘗試錯誤,最後學會做出正確的反應 效果律(law of effect):行為是否持續出現,決定於它的效果。
Thondike實驗的理論重點(講義145) 練習律: 隨著練習次數增加,正確反應與刺激間產生多次的連結,稱為練習率 準備率: 個體要解決問題,身心準備狀態也是重要因素。如果個體注意力不集中,或沒有興趣去獲得酬賞物,則刺激與反應間就不容易產生連結
操作的條件化 Skinner的研究 Thorndike的觀點在大約四十年後,在B. F. Skinner(史基納)手上大放異彩。他發展出許多精巧的技術,對行為作實驗分析,大大的擴展了行為研究的領域。
Skinner操作制約的主要論點(講義145) 個體表現行為之後,如能獲得滿意的結果,則該行為就獲得強化(reinforce) 。因此該行為重複出現的機率會增多。
操作的條件化 Skinner的實驗分析 Skinner的實驗儀器,叫Skinner箱(Skinner box),可用來訓練鴿子或老鼠學會各種行為。
為何叫做”操作”制約 受試者在操作(operate)它的環境,所以Skinner稱這種學習為操作制約(operant conditioning)。
操作制約 從行為主義者的角度看,了解人的想法是多餘的。促成老鼠不斷壓桿的,不是它的任何想法,而是伴隨著壓桿動作而來的食物丸子(或其他獎賞物) 。
Skinner 操作制約的學習理論(講義146) 正強化作用(positive reinforcement): 個體表現某種行為之後,如果能立即獲得酬賞物(reward) ,該行為得到強化,個體再次表現該行為的機率增加 這個酬賞物稱為正強化物(positive reinforcer):種類可能是食物、金錢、稱讚、優待、權力、成就感等
Skinner 操作制約的學習理論(講義147) 負強化作用(negative reinforcement):個體表現某種行為之後,立即終止其所厭惡的刺激,則該行為會得到強化,個體再度表現該行為的機率將隨之增加。 這個被終止的刺激稱之為負增強物(negative reinforcer) :可能包括電擊、處罰、嘲笑、嘮叨、罰錢等 因負強化物的消失,使個體的行為得到強化
懲罰 正懲罰(positive punishment): 個體表現某種行為之後,立即給予其所厭惡的刺激,則該行為會被抑制,個體再度表現該行為的機率將隨之減少 負懲罰(negative punishment): 個體表現某種行為,立即去除其所喜愛的刺激則該行為會被抑制,個體再度表現該行為的機率將隨之減少
強化與懲罰的區辨圖表 行為強化 (Operant response increases) 行為抑制 行為強化 (Operant response increases) 行為抑制 (Operant response decreases) 刺激呈現 (stimulus presentation) 正強化 Positive reinforcement 正懲罰 Positive Punishment 刺激去除 (stimulus removal) 負強化 Negative Reinforcement 負懲罰 Negative Punishment
習得的無助感(講義147) 如果個體嘗試各種行為,都無法終止厭惡的刺激,就可能學習到沒有希望的無助行為,這種現象稱為習得無助感( learned helplessness) ,習得無助感有可能導致憂鬱症
操作的條件化 穿梭箱 穿梭箱(shuttle box)是研究負面強化的儀器。它是隔成兩半的長方形箱子,中間有一道矮矮的隔間,它可以升起,以便將箱子的兩半完全隔斷。 它的地板是由金屬條組成的,因此可以通電。電路的設計是,當一邊通電的時候,另一邊就沒電。
強化時制:強化物出現的時間(講義147) 行為出現後馬上出現增強物學習效果較佳 若過一段時間再給予增強,這種延宕強化, 學習效果較差
強化時制:強化物出現的時間(講義148-149) 強化時制(reinforcement schedule) 指的是強化的頻數、強化的時間間距等的不同安排。 連續強化:每次出現操作性反應都獲得強化。 應用時機:建立新行為時 間歇時制或部分強化時制:只有部分操作性反應獲得強化。 應用時機:新的行為達到穩定的程度之後
強化時制:強化物出現的時間(講義149) 間歇時制可以區分為四類: 操作的條件化 強化時制:強化物出現的時間(講義149) 間歇時制可以區分為四類: 固定比率時制 :依反應的次數強化時制:強化物出現的時間對固定的比例的反應給予強化 。 不固定比率時制:個體不一定要做出幾次反應,才能得到正強化物 固定時距時制 :依固定的時間間隔給予強化 。 變動時距時制 :按時距強化,但時距是變動的,只是有一個預定的平均時距 。
間歇時制的效果 間歇強化的效果並不輸於連續強化。 操作的條件化 間歇時制的效果 間歇強化的效果並不輸於連續強化。 經由間歇強化學得的操作性反應,比經由連續強化學來的,更不易消除。這種特殊效果,稱為部分強化效果(partial reinforcement effect)。
操作的條件化 其他重要概念:操作制約的消除 (講義150) 既然在壓桿可以獲得食物的情況下,壓桿行為被建立了起來,顯然,只要壓桿不再能獲得食物,壓桿的行為應該就可以被去除。 實驗結果完全符合預測:當壓桿不再能獲得食物,老鼠每多壓一次按桿,它下次再壓桿的時間間隔就會拉長一點,直到壓桿的行為完全消失。 與正統條件化的情況一樣,這個去除行為的歷程也叫做「消除」。
重要概念:行為的型塑 (shaping)(講義148) 欲使個體表現比較複雜的行為 需將行為與目標行為之間 分解成幾個步驟施予操作制約學習 學會第一個反應後 再學會第二個反應 依循「循序漸進」的原則。終能表現複雜行為 這種循序漸進的訓練稱為行為的型塑(shaping)。讓高難度的學習可以由許多簡單的學習累積而成。
重要概念: 原始強化作用與次級強化作用(講義148) 原始強化物: 直接滿足物體生理需求的刺激物 如食物 水 性 原始強化作用:藉由原始強化物來強化個體行為的學習歷程 稱為原始強化作用 次級強化物: 間接滿足個體需求的刺激物 (滿足心理需求) 如金錢 稱讚 微笑 成績 地位 關懷 獎品 次級強化作用:藉由次級強化物而強化個體行為的學習歷程 稱為次級強化作用
什麼東西適合當強化物?(課本210 ) 我們對各種活動的喜好可以依其程度排成一個喜好階層系統(preference hierarchy); 觀念百寶箱 什麼東西適合當強化物?(課本210 ) Premack原則(Premack’s principle): 我們對各種活動的喜好可以依其程度排成一個喜好階層系統(preference hierarchy); 在喜好階層系統中居於較高階層的活動,可以用來強化較低階層的活動。 譬如說,對於愛看書不愛運動的孩子,可以用看書來強化他的運動行為規定每運動一小時就可以看一小時電視。反之,對於愛運動不愛看書的小孩,則反過來用運動強化他看書的行為規定每安靜地看書一小時,就可以運動一小時。
Premack原則在生活上的應用 將自己喜歡做的事列出來 將自己不喜歡,但又“必須”做 或“應該”做的事列出來 將”喜歡做的事”當成不喜歡做的事的正強化物
觀察學習 重要學者: Bandura 觀察學習: 由觀察進而模仿楷模者 (model)的行為 人不一定要自己的行為被正增強或負增強,行為才會型塑,觀察他人行為的後果一樣可以影響個人的行為
孩子為什麼成為小暴君? 觀察學習 經典實驗(Bandura): 讓三組幼兒園孩子看 錄影帶,錄影帶中有 一個成人攻擊一個成 人大小的充氣塑膠人
把充氣人放倒,坐在身上打它的鼻子,邊打邊叫 「哈!打中了!」 把充氣人拉起來,用木槌連續擊它的頭,一邊說「哈!趴下!」 用木槌打完後,又把充氣人踢來踢去,高興地叫「飛了!」
最後,用橡皮球猛砸充氣人,每砸一下都說「咚!」
第一組小孩看到另一個人用飲料和零食獎勵的攻擊者 第二組小孩看到攻擊者被人用捲起來的雜誌打了一下,並警告下不為例 第三組小孩看到攻擊者沒有任何結果,沒有被表揚,也沒有被責罵
接下來,讓孩子自由活動十分鐘,裡面有許多玩具,還有充氣人及當時所用的攻擊用具
所有孩子都表現了一定的攻擊行為 但看到被表揚的孩子比和到被責備的孩子,表現更多攻擊行為
認知學習 (講義153) 行為主義者稱人的內心為黑箱(black box),刻意加以忽視,而致力於操弄刺激(S),然後觀察反應(R),以找出刺激與反應間的關係。因此行為主義心理學又稱為S—R心理學(S—R psychology)。 今天已有足夠的證據顯示,黑箱裡頭的活動其實至關重要。除了刺激、反應、強化物之外,認知活動——如知覺、記憶、思考等——在學習中都扮演著舉足輕重的角色。
頓悟學習實驗: 黑猩猩的問題解決行為 (講義154) 二0年代,Wolfgang Köhler對黑猩猩的問題解決行為做一系列研究。他觀察到的黑猩猩行為,和Thorndike難題箱中貓的行為,或Skinner箱中老鼠的行為,顯然大異其趣。
頓悟學習實驗: 黑猩猩的問題解決行為 (講義154) Köhler將一串香蕉吊在天花板上,讓黑猩猩蘇丹伸手夠不到。在籠子的角落裡,放著一個大箱子。起先,蘇丹試著跳起來抓香蕉,這個辦法顯然無效,蘇丹開始踱著步子,一會兒後,它停在箱子前,接著,彎下腰來,將箱子推到香蕉下面,然後站上去拿到香蕉。
「頓悟」 蘇丹的這些行為看起來似乎不是盲目的嘗試錯誤。 譬如說,它在一度失敗後,踱著步子,似已放棄了,接著,它突然表現出有效的問題解決行為,而且此後都能用相同或類似的辦法解決問題。 從外表看來,蘇丹似乎曾在腦中盤算,在想出辦法前,行為上沒有任何徵兆,直到想到辦法,才突然表現出來。因此Köhler稱之為頓悟(insight)。 假如我們不能用外在的強化去解釋蘇丹的學習,便只能歸諸於認知活動。
認知學習: 方位學習實驗(講義155) 老鼠跑迷津的實驗 顯示老鼠心理可以產生“認知地圖”