Chapter 4 學習理論.

Slides:



Advertisements
Similar presentations
甲狀腺甲狀腺 一年 六 班 一年 六 班 第 六 組 第 六 組. 位置 * 頸部前方, 喉部氣管兩側。
Advertisements

工職數學 第四冊 第一章 導 數 1 - 1 函數的極限與連續 1 - 2 導數及其基本性質 1 - 3 微分公式 1 - 4 高階導函數.
大綱 1. 三角函數的導函數. 2. 反三角函數的導函數. 3. 對數函數的導函數. 4. 指數函數的導函數.
自由落體運動:主題 一、自由落體( Freely Falling Body ) 二、一維自由落體運動的特性 範例 1 自由落體( v 0 =0 ) 範例 2 自由落體的函數圖 範例 3 鉛直上拋 範例 4 自由落體運動公式.
第十章 分 配 理 論 INDEX 第一節 所得分配的基本概念 第二節 生產要素的需求 第三節 分配的邊際生產力理論
學習歷程 陳富美.
智力測驗計分與解釋 輔導老師 黃曉樺.
LED CUBE 預期規劃.
音樂之旅 第一冊 單元二 音名、唱名.
行為主義心理學 行為學習論主張 1.將學習歷程解釋為條件作用(制約作用) conditioning。
上、下學時 搭乘汽車請舉手!. 上、下學時 搭乘汽車請舉手! 小朋友 是否知道搭乘汽車 要注意到的事情是什麼? 小朋友 是否知道搭乘汽車 要注意到的事情是什麼?
認識倍數(一) 設計者:建功國小 盧建宏.
Chapter 5 迴圈.
行政院衛生署藥物食品檢驗局 醫療器材審查員 陳羿羚
全威圖書有限公司 C0062.
現代心理學 (重修版) 張春興 第一章 對現代心理學的基本認識.
第七章 浪漫與殺手﹝婚前性行為,墮胎﹞   I.婚前性行為 「少年人,你要逃避淫行。」--- 聖經.
Regression for binary outcomes
細胞膜的雙磷脂層 (Phospholipid bilayer in cell membrane)
Q101 在701 SDX Linux上的標準安裝與使用程序v2
REGRESSION FOR ORDINAL OUTCOMES 「順序尺度依變項」的迴歸模型
電子商務基本概念 電子商務的定義 1-1 電子商務的特性 1-2 電子商務的演進 1-3.
電腦硬體裝修乙級 第二站-伺服器端系統安裝與環境設定
在NS-2上模擬多個FTP連線,觀察頻寬的變化
CHT IPv6測試 D-Link Taiwan 友訊科技台灣分公司 TTSS 電信技術支援課 Name:
Chap3 Linked List 鏈結串列.
2.1 內能 物體儲存的能量 粒子的能量 物體的內能 進度評估 第 1 冊 單元 2.1 內能.
大數據與我 4A 陳駿榜.
第一章 直角坐標系 1-3 函數圖形.
為成功制定目標和行動計畫 國際獅子會分區主席訓練.
六9考題(物質循環) 自然界中的二氧化碳會經由哪兩種作用而循環不已? (10%)
網路工具運用 講師:鍾詩蘋.
哪些人是管理者? 管理者? 指和一群人工作,並藉由協調他人來完成工作,以便達成組織目標的人
Definition of Trace Function
學習內容 概說 損失函數 雜音:造成品質變異的原因 訊號雜音比 直交表 回應表與回應圖 田口方法.
新高中 通識教育科 教案設計分享會 沙田循道衛理中學 許文忠老師 2019/4/25.
CH05. 選擇敘述.
微積分網路教學課程 應用統計學系 周 章.
Chymotrypsin Catalytic Mechanism A1
實用數學 長度單位的認識與換算.
機會成本知多少 機會成本的定義 1.
機會成本知多少 機會成本的定義 1.
數字獨樂樂 --數獨原來這麼簡單.
小學數學科 方塊圖 製作 — 麥頌儀老師 (青山天主教小學上午校).
維高斯基( ) Langford, P. (2005). Vygotsky's developmental and educational psychology. Hove England ; New York: Psychology Press.
18-3 課堂整理 第十五組 0993B010 張維哲 0993B042 游博雄.
Video 影像 (VideoPlayer 影像播放器、Camcorder 錄影機) 靜宜大學資管系 楊子青
流程控制:Switch-Case 94學年度第一學期‧資訊教育 東海大學物理系.
MiRanda Java Interface v1.0的使用方法
教育概論 教育原理與制度試題解題與分享 第五組
師大 KSP 操作手冊.
二項分配-Binomial 伯努利試驗(Bernoulli Trial) 每一次試驗皆僅有兩種可能結果,不是成功(S),就是失敗(F)。
3-2 錐度的種類 一、自緊式錐度 二、自鬆式錐度.
細胞.
第1章 認識圍繞著我們的鄰居 : 電磁波(electromagnetic wave)
1-1 二元一次式運算.
音樂之旅 第一冊 單元五 級進、跳進、旋律動向.
資料擷取與監控應用實務.
貳.企業願景、使命與目標(1/3) 願景 利害關係人 內部利害關係人 外部利害關係人 高階領導者必須創立一種以顧客為焦點的、清晰可見的價值
超我服務 Service Above Self
一 可靠度問題.
聲音的產生.
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
苦海救生: -義工督導技巧.
一個有效率的團隊的要素 Elements of an Effective Team
Chapter 4 Multi-Threads (多執行緒).
Application of NeuroScience
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
第三章 比與比例式 3-1 比例式 3-2 連比例 3-3 正比與反比.
CHT IPv6測試 D-Link Taiwan 友訊科技台灣分公司 TTSS 電信技術支援課 Name:
Presentation transcript:

Chapter 4 學習理論

第一節 帕夫洛夫式的制約 ── 一個刺激預示了另一個 刺激的到來 第一節  帕夫洛夫式的制約 ──     一個刺激預示了另一個     刺激的到來 俄國生理學家帕夫洛夫(Ivan Pavlov)揭櫫聯結式學習原則,稱為帕夫洛夫式的制約。 又稱:帕夫洛夫式的制約歷程、古典制約、古典制約歷程。 http://zh.wikipedia.org/wiki/%E5%B7%B4%E7%94%AB%E6%B4%9B%E5%A4%AB%E5%AF%A6%E9%A9%97

帕夫洛夫及助手發現實驗用狗對鈴聲之中性刺激(NS, neutral stimulate),不會出現有任何刺激唾液分泌的反應(不能引發唾液分泌反應的刺激並非都能做為中性刺激!),但狗看到食物及進食的時候則會大量分泌唾液。 當食物出現時,不需任何經驗就能使處在飢餓狀態下的狗反射式地分泌唾液。 食物被稱為無條件刺激(US, unconditional stimulate);由無條件刺激引發的唾液分泌則稱為無條件反應(UR, unconditional response)。

當中性刺激(NS)在往後的經驗中,開始和無條件刺激(US)經常相伴出現,實驗用狗漸漸地就不再視鈴聲是一個無關緊要的中性刺激。 此時鈴聲即使單獨出現(並沒有食物的相伴出現),也能引發唾液分泌的反應(response)。 中性刺激因為多次和無條件刺激相伴出現,才能引發唾液的分泌反應(response) ,稱為條件化刺激(CS, conditional stimulate)。 條件化刺激所引發的唾液分泌反應,稱為條件化反應(CR)。

圖4-1 中性刺激因為多次和無條件刺激相伴出現的安排下,逐漸轉為條件化刺激 ── 帕夫洛夫式的制約 圖4-1 中性刺激因為多次和無條件刺激相伴出現的安排下,逐漸轉為條件化刺激 ── 帕夫洛夫式的制約

無條件反應(UR, unconditional response)無條件刺激所產生的反應。 無條件反應的單位時間分泌量較條件化反應為多。 無條件反應在食物出現後會迅速的出現;條件化反應在鈴聲後,會有一段較長的延宕後才出現。 條件化反應在食物(無條件刺激)多次皆不出現的情況下,將迅速減弱,甚至最後無法量測到。 無條件反應不因食物出現的經驗而改變,只需飢餓的動機存在,無條件刺激皆可引發無條件反應。

一. 帕夫洛夫式制約形成的原則 條件化刺激和無條件刺激出現時間要非常接近,才能使條件化刺激預測無條件刺激即將出現的關係建立起來。 尬西亞研究顯示,條件化刺激與無條件刺激之間出現時間的接近,倒不是一個制約建立的必要條件。(例如,誠實的制約.txt) 瑞司彄拉提出:條件化刺激及無條件刺激共同出現的可能性,才和制約的建立與否,以及條件化刺激的特性有著密切的關係。

如果條件化刺激(CS)不論其出現與否,無條件刺激(US)都有可能出現。機率學:P(US/CS)=P(US/no CS),制約是無法建立。 若是條件化刺激(CS)的出現常伴隨無條件刺激(US)的出現,且無條件刺激不常在條件化刺激不出現時反倒出現,P(US/CS)>P(US/no CS),較可能形成制約,下一次 CS 若出現,US 也非常可能出現。

二. 帕夫洛夫式制約建立的判準 條件化刺激(CS)在呈現時,足以引發條件化反應(CR)的發生,即可做為帕夫洛夫式制約已成功建立的判準。 比較帕夫洛夫式制約建立的強度,以條件化反應(CR)的量、條件化反應(CR)出現的延宕時間,或條件化反應(CR)出現的機率作為標準。相同的條件化刺激(CS)和無條件刺激(US)依序相伴出現的經驗愈多,該條件化刺激在單獨呈現時,引發的條件化反應會較大、較快、機率愈大。 在固定次數的相伴出現經驗後,比較兩個不同的條件化刺激所造成的條件化反應的大小、快慢及出現機率。 生物體愈容易察覺、注意的條件化刺激,能建立強度較強的帕夫洛夫式制約。以帕夫洛夫的實驗用狗為例,在相同的制約嘗試後,70 分貝的鈴聲較 10 分貝的鈴聲建立起較強的制約。

三. 帕夫洛夫式制約形成的機制 黑伯式突觸:突觸後神經元的細胞膜接收來自條件化刺激及無條件刺激兩方面的興奮訊息。 代表無條件刺激的強大訊號,每一次都夾著大量麩胺酸釋放的聲勢,順利且依序引發突觸後神經元細胞膜上兩種離子管道型接受器的開啟,造成鈉離子及鈣離子自胞膜外急速湧入,鈉離子的湧入使膜電位趨向去極化。 興奮的訊息向神經末梢傳遞,經許多神經元最終刺激三對唾液腺,並分泌大量的唾液。

條件化刺激在未「條件化」前是一個中性刺激。 代表中性刺激的訊號到達黑伯式突觸時,造成麩胺酸釋放的量較少,或因突觸的正對面僅有少數離子管道型接受器存在,使得突觸後神經元細胞膜的極化電位並不能劇烈發生去極化的作用。 突觸後神經元因此無法形成興奮的訊息。

依帕夫洛夫式制約形成原則,使中性刺激和無條件刺激相伴接續出現,加成效果刺激除了引發突觸後神經元細胞膜的興奮外,鈣離子湧入會活化神經元內相關酵素及核內轉錄因子活化,啟動某些基因的表達和蛋白質的新生成。 離子管道型接受器在中性刺激傳入位置的導引下,將被嵌放至最靠近中性刺激傳入位置的細胞膜上。

另一種可逆向傳導的化學物質在合成後,自突觸後神經元傳入中性刺激傳導神經元,增加中性刺激傳導神經元內麩胺酸的合成及釋放。 本為中性的刺激雖不足以興奮突觸後神經元或造成唾液分泌,和無條件刺激的相伴出現,使負責中性刺激的傳導神經元改變為麩胺酸釋放較先前多、正對突觸位置的接受器數量也增高的現象,因此中性刺激才能轉變成為條件化刺激。 條件化刺激不若無條件刺激的傳導突觸強度,但可單獨引發類似無條件反應的條件化反應。

圖4-2 黑伯式突觸的改變可以說明帕夫洛夫式制約形成的原因 圖4-2 黑伯式突觸的改變可以說明帕夫洛夫式制約形成的原因

圖4-2 黑伯式突觸的改變可以說明帕夫洛夫式制約形成的原因(續) 圖4-2 黑伯式突觸的改變可以說明帕夫洛夫式制約形成的原因(續)

就心理機制而言: 一派理論認為:條件化刺激和無條件刺激經由重複多次相伴的呈現,有機體不需經由意識的監控,就將兩個刺激聯結起來。聯結之後,有機體對條件化刺激的感覺或反應就如同對無條件刺激一樣。 另一派理論強調:有機體會以理解的方式,解釋條件化刺激的出現,預示無條件刺激即將要出現。帕夫洛夫的實驗用狗不是對著鈴聲去分泌唾液,而是經由過去的學習經驗而理解到鈴聲預言食物這個概念,而食物這個概念出現後,自然會引發唾液的分泌。

瑞司彄拉使老鼠學習以閃光(條件化刺激)預測一個強大聲響(無條件刺激)的即將到來。 當老鼠學會這個制約後,每當牠們看到閃光時,會表現出僵凝不動的害怕反應。 前者的理論會預測老鼠在稍後看到閃光時,還是會表現僵凝不動的反應,畢竟閃光和強大聲響有非常緊密的聯結關係。 後者的理論預測老鼠因對無條件刺激的疲化作用,老鼠應該不會表現出僵凝不動的反應。結果完全如後者理論所料!

四. 無條件刺激和條件化刺激的順序 前瞻式制約:條件化刺激(CS)總出現在無條件刺激(US)之前。

逆向式制約:如果將無條件刺激(US)的呈現提前,而無條件刺激呈現結束後,條件化刺(CS)激始出現。經歷這種制約歷程後,條件化刺(CS)激可能會獲得一種抑制行為的特性。若和其他可刺激唾液分泌的條件化刺激一起出現,會使其他條件化刺激引發唾液分泌的效果減弱。 時間式制約:並沒有明顯的條件化刺(CS)激出現,但無條件刺激(US)在固定的時間流逝後即出現。

五.條件化刺激效果的消失、區辨和類化 條件化刺激引發的條件化反應,隨著程序進行漸漸減弱,最終完全消失。 應用帕夫洛夫式制約原理形成的作業可應用此程序,直至條件化刺激完全無法引發任何可量測的條件化反應。 例如:自發的回復為一種程序,說明帕夫洛夫式制約的學習並未被「遺忘」。隨著時間流逝,條件化刺激突然呈現,引發條件化反應再次出現。

重新訓練: 在條件化刺激已不能引發條件化反應之後,若將條件化刺激和無條件刺激再次伴隨呈現,用不著最初制約訓練那麼多次的嘗試,條件化刺激單獨的呈現即可引發很大的條件化反應。

去抑制程序: 當無條件刺激不再隨條件化刺激而出現時,對有機體而言應是一種新的學習和經驗,有機體必須學習抑制條件化反應,表現出已習得這個新的聯結。 若能以一個新的、顯著的中性刺激轉移有機體「專心」的抑制,條件化刺激即可能再次引發條件化反應。

條件化刺激和無條件刺激的聯結,並未因條件化反應暫時的不出現而完全消失。 這個行為的消褪並不表示聯結學習不復存在的現象,預示行為主義未來的危機,也說明生物體內動機的存在。 內在的心智運作和外顯行為之間常發生這種多對一的函數關係。 心理學的初學者常需憑藉著對外顯行為的觀察與測量資料,盡可能去推測這個行為是何種心智運作的歷程所造成的,而非其他心智運作的歷程所造成。

區辨和類化都是針對某個刺激和條件化刺激在許多特性上的不同或近似而言。 湯普森將刺激電極的尖端深埋在橋腦的神經核中。以眼球同側橋腦神經核的電刺激做為條件化刺激,並和眼球附近肌肉電刺激這個無條件刺激相伴出現,很快就能使兔子獲得這個制約學習。 生物體能夠區辨看似和條件化刺激相近的刺激,其實並不是制約時的條件化刺激,也完全不能引發條件化反應。

類化的研究最著名且頗有悖於當前倫理學判準的研究是華森和瑞訥在小阿伯特的幼童造成一種制約的恐懼反應。 當小阿伯特經歷了 7 次小白鼠和大得足以令人跳起來的聲響相伴出現的制約後,小白鼠的出現的確造成小阿伯特很大的恐懼反應。 隨後,小阿伯特開始對類似的刺激(如白色的兔子、白色的狗、白色的皮外套、白色的頭髮)也產生恐懼反應。

六. 帕夫洛夫式制約的延伸 ── 從後天的學習去改變我們本能的反射反應 (一) 二級制約 當一個中性刺激獲得了預測無條件刺激即將要出現的能力後,稱為條件化刺激。 可引發類似無條件反應的條件化反應外,也可以作為一個「無條件刺激」。

經由相同的制約形成原則,這個條件化刺激可以使另一個中性刺激轉變為條件化刺激。這種延伸一次的制約稱為二級制約。 在愈多級的制約程序後,最後才建立的條件化刺激所能引發的條件化反應勢必漸形減弱。

(二) 制約前感覺聯結 在制約進行前,將兩中性刺激多次伴隨呈現;隨後將其中一個中性刺激和無條件刺激建立起制約的關係。 這一個中性刺激在制約程序後轉變為條件化刺激,單獨呈現該條件化刺激能夠引發類似無條件反應的條件化反應。

另一個未參與制約訓練的中性刺激,在單獨呈現時,也能引發較弱的條件化反應,稱為制約前感覺聯結。 其重要之處是中性刺激之間也能形成聯結式的學習。

(三) 潛在抑制 若中性刺激已預先出現多次,且無條件刺激也未出現過,決定開始將此中性刺激及無條件刺激進行制約的歷程,需較久的時間才得以建立。 中性刺激伴隨著無條件刺激的不出現,抑制後來中性刺激和無條件刺激之間制約形成。 潛在抑制說明了學習是無時無刻不在進行的。

(四) 阻斷 如果一中性刺激先行和無條件刺激進行制約的歷程,隨後加入另一中性刺激,和前一中性刺激共同與無條件刺激進行制約的歷程,加入的中性刺激幾乎無法獲得一丁點兒預測無條件刺激出現的力量。

阻斷可能和有機體為節省能量的消耗有關,因為已形成的條件化刺激始終堪用,注意力的能量花費應盡量減低,導致忽視後加入的中性刺激。

(五) 建立抑制性的條件化刺激 以中性刺激和無條件刺激進行制約的建立,在下一階段中,引入一個新的中性刺激。 當此中性刺激和已條件化的刺激同時出現,無條件化的刺激就不出現。 當已條件化刺激單獨呈現時,無條件刺激照例一定出現。

當這個程序進行一段時間後,後引入的中性刺激就會轉變為一個條件化的抑制性刺激。 在帕夫洛夫的例子中,這種刺激不能引起任何唾液的分泌。

加成測試: 如果某個條件化刺激已獲得抑制唾液分泌的能力,將這個條件化刺激和另一個已條件化的興奮性刺激一起呈現,其所造成唾液分泌的量,會顯著地低於興奮性的條件化刺激單獨呈現時,所能引發唾液的分泌量。

可遲滯測試顯示條件化刺激的抑制特性。 將已獲抑制唾液分泌能力的條件化刺激和無條件刺激進行制約的歷程,若建立此種制約需時甚久,則可支持加成測試的結果。

另一種建立抑制性條件化刺激的方式: 將一中性刺激和一個威脅生存的無條件刺激進行一般的制約歷程,這種威脅生存的無條件刺激,自然能引發逃避的無條件反應。 經過制約的歷程後,該中性刺激轉變為條件化刺激,在單獨呈現這個條件化刺激時,毫無意外的可以引發逃避的條件化反應。

因為威脅生存的無條件刺激太可怕,有機體甚至將中性刺激和恐懼感形成了聯結的制約,也就是條件化刺激的呈現還可以引發恐懼感。 條件化刺激的呈現,會引發抑制一切其他行為表現的僵凝不動,具備抑制的特性。 這種抑制性的條件化刺激直接抑制所有明顯的行為表現,不需要經過和其他條件化刺激的加成互動。

(六) 顯著的中性刺激遮蔽不顯著的中性刺激 將兩個以上的中性刺激和一個無條件刺激進行制約歷程,易為有機體察覺和注意的中性刺激會轉變為條件化刺激,其他較不易察覺和注意的中性刺激不能轉變為條件化刺激。 中性刺激會遮蔽較不顯著的其他中性刺激和無條件刺激形成制約的能力。

七. 學習的速率、反應消失的速率及學習效率的增進 將條件化刺激與無條件化刺激相伴呈現多次後,條件化刺激單獨呈現所能引發的條件化反應,不再有明顯的增加。 此時條件化反應量的大小或出現的機率,認定為學習已經完全達成的狀態。

條件化刺激與無條件刺激需要相伴呈現多少次,才能達成完全學習的狀態,和許多因素有關。 條件化刺激和無條件化刺激在最初的若干次相伴呈現經驗中,已接近完全學習達成的狀態。 相伴呈現的學習經驗僅僅微幅地增加條件化反應的強度。

以帕夫洛夫式制約原則所建立的許多學習作業中,學習的速率大致上呈現一個負加速情形。 當帕夫洛夫式制約建立後,重複單獨呈現條件化刺激會造成條件化反應(學習的結果)逐漸減弱至消失。這個學習結果消失的速率也呈現負加速的效果。

圖4-3 學習及減弱隨嘗試段落的變化趨勢

圖4-3 學習及減弱隨嘗試段落的變化趨勢(續) 圖4-3 學習及減弱隨嘗試段落的變化趨勢(續)

可以增進帕夫洛夫式制約學習效率的因素很多,特別的是分散學習效果。 在同一個嘗試區段中,將同樣次數的條件化刺激和無條件刺激配對呈現,在相距較遠的時間內,依次進行會形成較強的學習。 可能造成分散學習效果較佳的原因,是因為有機體較能輕易區分出每一次條件化刺激和無條件刺激相伴呈現的孤立。

如果一次相伴呈現和下一次相伴呈現時間太接近,有機體可能「誤解」為前一次無條件刺激出現,是預告了下一次條件化刺激的呈現。

條件化刺激和無條件刺激的契合與否,決定帕夫洛夫式制約學習進行快慢的關鍵。 某些條件化刺激比較適合和某些無條件刺激進行帕夫洛夫式制約學習,卻不適合和其他的無條件刺激進行制約。例如: 閃光和聲響可以輕易地和電擊進行制約,不適合和噁心欲吐的感覺進行制約。 嗅覺的刺激可以輕易地和噁心欲吐的感覺進行制約,不適合和電擊進行制約。

八. 臨床應用 暴露治療法: 對特殊事物、情境產生過度的恐懼反應,可能源自帕夫洛夫式制約的經驗,表現對特殊事物或情境的恐懼反應。 患者學習另一個帕夫洛夫式制約 ── 那些恐懼的事物或情境現在預告了應該懼怕刺激的不會出現。

洪水暴露法: 將患者暴露在所恐懼的事物或情境中,使患者自己去發現恐懼的結果並沒有發生。 通常使患者暴露於想像的恐懼事物或情境中,而非真實的事物或情境。

敏感遞減法: 擬出一個患者所恐懼事物或情境,並教導患者進行有效的肌肉放鬆。 讓患者經歷程度最低的恐懼事物或情境,以自我肌肉放鬆方法減除恐懼反應,直至完全不產生恐懼反應。 再讓患者經歷恐懼程度高一級的事物或情境;最後目標是不再產生恐懼反應。 如果小阿伯特對於引發恐懼感的條件化刺激類化是如此快速、廣泛,敏感遞減法針對多種可能的條件化刺激進行消除就顯示出其重要的價值。

第二節 工具式制約 ── 一個反應操縱了一個後果的發生 第二節  工具式制約 ── 一個反應操縱了一個後果的發生    工具式制約又稱為操作式制約,描述有機體以自己的行為做為工具,企圖去影響所處環境的一種規則。 有機體不只想影響環境,甚至主動操作環境,使這個環境成為符合有機體希望的環境。

一. 松戴克的結果律 松戴克研究“貓從謎箱???”中逃出的觀察,開啟工具式制約理論研究的先河。 有用或無用的行為,其判準全在於有機體的動機必須強烈,且行為的結果是必須能滿足有機體動機的。 松戴克之結果律定義:「行為後所獲得的正向結果,決定有機體未來較可能表現的行為。」

達爾文的演化論是將某一生物物種的生存繁衍交由自然來決定,松戴克的結果律則是將任一個體一生中行為的發展交由其結果來決定。 松戴克:「一個生物體如果學習了一個經驗而且還能全身而退,這個生物體就還有機會在日後繼續從事其他的學習。」

圖4-4 圖解松戴克的結果律

二. 行為結果的種類 司基訥歸納四種自發行為後出現的結果: 正強化物 reinforcement(或酬賞)。 負強化物 (或移除懲罰)。 懲罰 punishment (或正懲罰)。 負懲罰(或移除酬賞)。 youTube 制約四類型-憤怒鳥的一天

正強化物酬賞和負強化物移除懲罰:滿足有機體動機、需求的結果,可使有機體在日後傾向表現該自發行為,以使有機體能獲得利益。 懲罰懲罰和負懲罰移除酬賞:剝奪有機體的需求、利益,使有機體在日後不傾向表現該自發行為,以便於維護有機體的利益。 正強化物和負強化物(reinforcement)因為滿足需求所以可以增加自發行為出現的機率(塑造行為建立的強度)。 懲罰和負懲罰(punishment)因為剝奪需求可以減低自發行為出現的機率(促使行為的消失)。

酬賞和移除懲罰(reinforcement)可以增加自發行為出現的機率(塑造行為建立的強度)。 懲罰、移除酬賞(punishment)可以減低自發行為出現的機率(促使行為的消失)。 當預見懲罰或移除酬賞可能要發生時,可選擇暫時不要做出該項行為,或選擇先離開這個情境,等到「安全」的情境和時機到來時再表現該行為。從以我們往往寧可鼓勵自發行為的建立(reinforcement),而比較不傾向「鼓勵」自發行為的消失(punishment)。

三. 每一個個體的強化物可能是不同的 「我之良藥,彼之毒鴆」、「鐘鼎山林,各有天性」說明每一個人所喜好、趨向的事物可能有所不同。 每一個個體各自有對事物喜好的順序,有效強化物的選擇就必須考慮個別差異。 個體本就喜好、趨向的事物稱為主要強化物。 運用主要強化物,使得受試者願意從事沒那麼喜歡的活動,而且也漸漸覺得後者很有趣,稱為次要強化物。

圖4-5 每一個人對飲品各自有喜好

四. 腦內的化學物質和強化物的喜好 當多巴胺神經元受到電刺激後,位於神經末梢的間腦依核及中端前額葉皮質區釋放多巴胺於突觸,造成愉悅的感受。 許多主要強化物能刺激依核或中端前額葉的多巴胺釋放。 多巴胺釋放的多寡可能和動物多想要得到一個主要強化物有關,和主要強化物能產生多大的愉悅程度關聯不大。

五. 塑成一個行為 為達成跳過火圈的最終目標,老虎必須要有適當的助跑和跑速,要躍起且有適當的躍起高度以及要朝向特定的目標、要有穩定且高的成功穿越比率。 不同階段的目標較容易由老虎自發產生,經由強化物的適時提供,使這些不同的目標依序達成,稱為連續漸近。 連續漸近的策略被應用在複雜的目標行為,是運用操作式制約的原理去塑成複雜行為或習慣的一個有效策略。

圖4-6 連續漸近是運用操作式制約的原理去塑成複雜行為的一個有效策略 圖4-6 連續漸近是運用操作式制約的原理去塑成複雜行為的一個有效策略

六. 給予強化物的方式 (一) 連續或部分強化 為鼓勵有機體持續的表現某些行為,連續地給予強化物的方式,在現實生活中窒礙難行。 部分強化強調──應鼓勵的行為出現時,有時能得到強化物,有時則否;在鼓勵行為的表現上較不利,但受到鼓勵的行為也較不會因間或幾次遺漏強化物而不再出現。

(二) 部分強化的類別 次數強化程序 固定次數強化程序:指做滿一定次數的被強化行為,才能得到一次強化物的程序。 變動次數強化程序:指平均要做滿一定次數的被強化行為,才能得到一次強化物的程序。 次數強化程序可使有機體表現頻繁的強化行為,也可用以推測有機體想要得到強化物的動機有多強。

時間強化程序 固定時距強化程序:指有機體必須等待一段固定的時間後,所表現的被強化行為才能獲得強化物。 變動時距強化程序:指有機體平均等待一段固定的時間後,所表現的被強化行為才能獲得強化物。 時距強化程序較重視有機體能量的節約,而強調有效率地表現被強化行為。

強化少反應程序 如果有機體在固定時間尚未過去即表現被強化行為,需重新計時;在固定時間尚未過去即行表現等於是一種錯誤。 能使有機體表現出較少、但適時的被強化行為。

七. 工具式制約中的認知原則 潛伏學習: 熟悉迷津的道路也是一種學習,學習目標沒有清楚的界定,也沒有強化物的提供。 老鼠可能在腦中建立一個迷津地圖的表徵。當強化物出現在目標箱中(工具式制約開始進行),老鼠運用當初沒有目標的迷津地圖表徵加速工具式制約的進行。 無明確目標去表現學習的結果,但可以和工具式制約任意配合,並改變工具式制約中被強化行為的表現。

圖4-7 透門和格萊特門的實驗說明潛伏學習中的認知原則 圖4-7 透門和格萊特門的實驗說明潛伏學習中的認知原則

八. 工具式制約的應用 ── 學來 的無助感 消極的不行為由學來的無助感所造成。   的無助感 消極的不行為由學來的無助感所造成。 當狗受到痛苦的電擊(一種懲罰)後,懲罰的到來既無法預期、也沒能縮短、減弱或逃開懲罰,使動物不再表現那些常作的但「無用的」行為。

動物的「不作為」可能和電擊停止(懲罰移除或負強化)產生工具式制約。 學來的無助感所造成的不行為,和一些由挫折經驗引起的憂鬱症狀類似。 諮商策略是使案主了解到挫敗的結果是可以改變的,或和案主商擬未來可能改變結果的行為因應方式。

第三節 觀察或替代式學習 ── 一個學自別人的經驗 第三節  觀察或替代式學習 ──     一個學自別人的經驗 一. 觀察(替代)學習的價值 有機體若依帕夫洛夫式制約或操作式制約原則進行學習,則必須親自參與。

事事躬親學習不能避免身陷危險,在演化的過程中,發展出不必親身參與的安全學習方式 ── 經由同種生物其他個體的行為結果來學習。 別人的結果代表我們親身經歷的可能結果,稱為觀察或替代式學習。

二. 經典實驗 班度拉給小朋友觀看成人和 BoBo 充氣小丑互動的影片: 於影片中看過成人攻擊充氣小丑的小朋友,被帶至影片錄製的房間中,會展現較多且類似成人攻擊充氣小丑的行為。 看過成人攻擊小丑受到鼓勵的小朋友,在錄製影片的房間中,傾向表現相似的攻擊行為。

三. 觀察(替代)學習的一些原則 有機體所學習的對象即為接受觀察的對象,稱為模範── 仿效的對象。 觀察學習不會隨意發生。

促使觀察學習發生的原則: 觀察者必須在觀察過程中注意到模範的行為。 觀察者必須記得所觀察的情景,並且能適時地憶起當時觀察的情景。 觀察者本身必須有足夠的動機,使自己完全依照所觀察的行為方式來表現。 觀察者本身必須具備表現該行為的能力。

圖4-8 有機體仿效觀察對象的行為

下列情況使模範的行為方式深植在觀察者的記憶中,並使觀察者有動機去仿效模範的行為: 觀察者專心的觀察模範的行為時,能受到鼓勵。 觀察者自認為和模範之間的特徵或性格特質有相似之處。 模範是值得喜歡和尊敬的。 模範的行為已經受到鼓勵。 模範的行為是清楚而容易注意到的。