第十五章 時間數列分析 陳順宇 教授 成功大學統計系
周期 交通尖峰時段 (每天早上的七點到九點,下午的五點到七點,時間單位為小時,周期為24), 週一症候群 (學生每週一上課感到特別倦怠, 時間單位為天,周期為7), 某公司度小月 (每月營業額有大月小月, 時間單位為月,周期為12)
季節性,趨勢 這種每隔等距時間 就會出現的現象就是季節性。 另外在股票市場也常聽到大盤走勢如何 這是指過去一段時間所有股票交易價格的趨勢
時間數列 許多企業或經濟上的資料是 依時間先後順序收集, 這種資料稱之為 “時間數列”資料, 也就是時間數列資料是縱向的
時間的單位可以是 每一天或 每一週或 每一月或 每一季, 甚至每一年,
圖案 由x的觀察值找出過去一段時間 其行徑的"圖案"(或稱型態 Pattern), 再由此圖案對未來值做預估,
預測 這種利用過去資料所含的圖案 對未來做預估的工作稱為"預測" 優點是只要利用過去資料 就能對變數做描述與預測,
未來是過去的延伸 缺點是以過去資料對未來做預測 必須假設 “圖案”重覆出現, 即假設“未來是過去的延伸”,
16.1 預測的需要與預測方法 (1) 企業組織愈來愈龐大, (2) 企業愈來愈需要系統化的決策,
(3) 企業周遭環境改變迅速, (4) 預測方法及知識愈來愈普及,
預測分為兩大類 定性分析法, 定量分析法,
1.定性分析法 (1)自然推論法: 如八卦、紫微斗數、易經 (2)銷售組合法: 推銷員以本身經驗就其所服務區的 產品及顧客,做銷售額判斷,
(3)德爾菲法: 是多次與專家溝通後得到共同結論 ,
(4)小組意見法: 集合一群人在一起討論, 以達到對主題形成共識
2.定量分析法 時間數列模式 迴歸模式
16.2 時間數列的成份介紹 資料xt對時間t所畫的散佈圖稱為 時間數列圖。 時間數列常可由其圖形判別出其圖案,
圖案分成四種成份 趨勢(Trend)、 季節性(Seasonality)、 循環性(Cyclity) 隨機性(Random)
例15.1、 台灣地區民國82年1月到91年12月十年間 每月資料(資料來源:中國統計通訊) x1:總人口數(單位:千人) x4:空氣污染率(單位:PSI > 100的比率) x5:用水量(單位:公升) x6:出國人數(單位:千人)
台灣地區82年至91年月資料
(a)總人口數
(b)離婚率
(c)失業率
(d) 空氣污染率
(e)用水量
(f) 出國人數
由上圖知台灣地區過去120月的 人口數成上升的直線趨勢, 每人每月用水與出國人數都有季節性,以夏季最高。
1.趨勢 趨勢(Trend,簡寫成TR)是 指一時間數列資料長期穩定地 延著某一曲線上升(或下降),
例15.2、 台灣地區過去24年男女性別比例 (單位:每百位女子對應的男子數)
資料
試畫其時間數列圖並求其線性趨勢
台灣地區過去24年性別比例 (民國68年到91年間)時間數列圖
線性趨勢 TRt=123.6891 0.2126t 即過去24年男生雖比女生多, 但差距愈來愈小,每年約下降0.2126, 利用此方程式可預估公元2016年 (即t=95)時,性別比例為 x=123.68910.2126 (95)=103.4917
2.季節性(Seasonality 簡寫為S) 或稱季節變動,是每年(或每週或每天) 在某固定時段量測數據都有 比其他時段大(或小)的現象。 在工商業常聽到所謂的大月、小月 就是季節性的表現,
例如飲料,冰淇淋,燃料油等的銷售 在夏季銷售量較高的情形。 而像交通其尖峰時間可能是每天 早上7~9點及下午5~7點。
3.循環變動 是描述資料如何對趨勢長期的循環移動, 每一循環的長度稱為此循環的周期 循環周期的計算可由量測數列中 一高峰到下一高峰的時間長度, 或是由一谷底到下一谷底的長度
循環周期
圖15.4 經濟景氣循環與 房地產循環關聯
4.隨機變動 隨機變動也稱不規則性 白噪音具有不規則性, 是不可觀測的,也是不可預測的,
圖15.5 各種時間數列圖
15.3 加權平均法預測 簡單平均法、 移動平均法、 中心化移動平均法、
1.簡單平均法
2.移動平均法 它是將“最近k期”的資料加以平均, 當做下一期的預測, 如股票市場的 六日移動平均線, 十日移動平均線, 其原理即源自移動平均法。
k期移動平均,寫成MA(k), 它是最近的k期資料xt-k+1 , ... , xt的平均,即 對下一時段t+1的預測值為 Ft+1=Mt
3.中心化移動平均法 移動平均法除了可用來做預測, 但也可用來做"平滑"(Smoothing), 做為平滑用的移動平均則必須中心化,
奇數期k的中心化移動平均
偶數期k=2m中心化的移動平均
15.4 指數平滑法 簡單平均法、移動平均法都是 對過去資料做加權平均, 本節所討論的預測方法也是加權平均,
隨著時間愈遠,權重也跟著呈指數下降, 因此稱之為指數平滑, 在做預測時, 較近的資料給的權重 比較遠的資料的權重大
指數平滑法 其中xt 與Ft 分別是時段 t 觀察值與預測值, 為平滑係數。
遞迴形式
重覆這樣過程
對各種平滑係數所對應之權重
(1) 簡單平均法
(2) 移動平均法(MA(5))
(3) 指數平滑法(=.4)
(4) 指數平滑法(=.8)
也可以下面的形式表達
例15.3、 台灣地區民國88年1月到民國91年12月 每月失業率如下表, 試分別以 =0.1 , 0.5 , 0.9 做指數平滑係數 試分別以 =0.1 , 0.5 , 0.9 做指數平滑係數 預測 91年12月及92年1月的失業率。
台灣地區每月失業率 (民國88年1月至民國91年12月)
(1)以=0.1為平滑係數
台灣地區失業率 指數平滑法預測圖
STATISTICA套裝軟體 時間數列
指數平滑法畫面
指數平滑法()
15.5 成份分解法 將時間數列分解成四個成份(Component), 趨勢、 循環效應、 季節效應 隨機性;
分解法預測 分解法基本上是1920年代所建立, 有許多不同的方式來分解時間數列資料, 將每一成份獨立出來,使預測更準確。
基本程序是 (1)先將季節效應去掉, (2)然後消除趨勢, (3)接著消除循環效應, (4)最後計算出殘差,
分解法的一般數學表示法
分解法兩種組合 加法性(Additive)組合與 乘法性(Multiple)組合
季節的分量可以是 加法性或乘法性, 例如,在12月份,某種玩具 每年都以1百萬元增加, 也就是對每年12月份的預測可以 增加1百萬來表達此季節影響, 在此種情形季節成份是加法性。
某一種玩具在每年12月份銷售量是以40﹪成長, 即以一個1.4的倍數增加, 當玩具銷售量少時則在12月份銷售量增加也少,(但是增加的百分比是固定的), 若每年同一季的增加是以相同的倍數 (此例中係數為1.4) 則此季節成份是乘法性的。
加法性是每年以固定的數量成長, 乘法性是每年以固定的倍數成長
分解過程是相似的, 由下列幾個步驟組成 1.對原始資料,計算以季節週期L為期的 中心化移動平均, 目的在於消去季節性與隨機性。 2.將中心化移動平均數從原始資料中移去 3.對L期每一相同時段算出平均數 以便找出季節指數。
4.找出趨勢的適當形式。 5. 去掉趨勢,得到循環效應Ct。 6.從原始資料中分離 季節效應、 趨勢 循環效應, 留下隨機性It,
1.加法性時間數列組合 xt = TRt + St + Ct + It
表15.6 加法性時間數列資料
圖15.10 加法性時間數列圖
(1) 中心化移動平均
季節指數之計算
季節指數
註1: 算出中心化移動平均CMA(4)是 數列的趨勢。 註2: d = x MA(4)是將數列去除趨勢, 因此d值包含季節指數與隨機性。 註3: 將各季的d值平均,基本上即為再 進一步去除隨機性而得季節指數
(3)去季節指數後的數列 y
趨勢 以去季節指數 yt 對時段 t 做 線性迴歸
隨機性 擬合值、殘差值與殘差平方
2.乘法性時間數列組合
例15.5、 設某公司過去10年每季產品銷售量 資料xt 如下表, 試以乘法性時間數列分解之
每季產品銷售量資料xt
圖15.11 乘法性時間數列圖
分成5個步驟分解此數列:
(1) 中心化移動平均
表15.11 週期 4 的中心化移動平均及比值t數列表
將上表中之比值依四季列出如下表,並算出各季比值的平均數
(2)季節指數
(3).將資料去除季節指數 利用上面算出之各季指數Si(i=1,2,3,4),以時間數列除以對應之季節指數,
表15.12 去除季節指數後之數列
(4) 趨勢分量 (即 yt 對時間 t 的線性迴歸) TRt=20.9663 + 1.6254 t
圖15.12 去除季節指數後 yt數列散佈圖及線性趨勢
(5) 循環性與隨機性
圖15.13 時間數列各個成份分解圖 (a) 時間數列xt及趨勢TRt成份
(b)季節指數St成份
(c)循環性Ct成份
(d)隨機性It成份
15.6 時間數列之迴歸分析 對於有季節性與趨勢的時間數列 也可使用迴歸分析方法。 它是以啞變數定義季節性, 並加入趨勢來做迴歸分析。 15.6 時間數列之迴歸分析 對於有季節性與趨勢的時間數列 也可使用迴歸分析方法。 它是以啞變數定義季節性, 並加入趨勢來做迴歸分析。 設趨勢為線性,即
而如季節周期為 L=4,則 定義三個季節性啞變數
加法性模式
例15.6、(例15.4續) 試以(15.36)式複迴歸做分析, 並預測第22筆資料
表15.14 以啞變數做季節性 迴歸分析擬分合值與殘差值 表15.14 以啞變數做季節性 迴歸分析擬分合值與殘差值
預測值 當預測下一季時,因屬第二季,故 Q1 = 0, Q2 = 1, Q3 = 0, 而t = 22 代入(15.37)式,得 因此在時段22時之預測值為53.8645。
註1: 以迴歸法所得的線性趨勢與 用分解法所得的趨勢很接近, 每年都以大約 42.0177 = 8.0708 增加
註2: Q1的係數8.8920, 它是第一季與第四季比較季節效應相差, 此與真正的季節指數 S1 = 7, S4 = 2的 相差72 = 9很接近, 也與利用加法性分解法算出的季節指數 S1 = 6.65908, S4 = 1.74342 之差距8.4025很接近。
在參數估計表中Q1係數的檢定 H0:2 = 0,P值= 0.0001, 顯示第一季與第四季季節指數顯著不同。 其他 Q2, Q3 係數也有相似結果。
註3: 若要檢定是否有季節效應,即檢定 可再跑只有趨勢的迴歸模式,即 得 R2 = 0.8217, SEE = 704.1197, 故檢定季節效應的F值為 所以季節效應是顯著的
第十五章 摘要
1. 了解時間數列資料與 隨機抽樣資料的異同。
2. 了解預測的需要與各種計量的預測方法
3. 說明時間數列的成份, 尤其季節性與趨勢的重要性以及 如何發現其圖案與分析
4. 學習傳統時間數列分析,如 移動平均、 指數平滑法 成份分析法
5. 了解指數平滑法中 平滑係數的選取對預測的影響
6. 中心化移動平均是做平滑用 而非預測用, 它在成份分解法中 計算季節指數扮演重要角色
7. 了解加法性與乘法性成份分解的 差異及分解過程
8. 利用定義季節啞變數方法做時間數列的迴歸分析, 並與傳統的成份分解法 或指數平滑法做比較
9. 學習利用統計套裝軟體執行時間數列