指導教授:陳牧言 老師 組員:資管四1 劉柏駿 陳柏村 蔡信宏 李志誠 洪聲甫 李紹剛 類神經網路與財務分析預測 指導教授:陳牧言 老師 組員:資管四1 劉柏駿 陳柏村 蔡信宏 李志誠 洪聲甫 李紹剛
報告大綱 緒論 文獻探討 研究方法 實驗結果與分析 結論 參考文獻 2017/3/11 類神經網路與財務分析
一、緒論 研究動機 研究目的 研究方法 研究資料與所需軟體 一、緒論 研究動機 研究目的 研究方法 研究資料與所需軟體
研究動機 股票市場一直是一個風險極高的投資市場,原因在於 影響股價的因素太多,使得股票市場難以預測 若類神經網路能夠有效的模擬此類複雜系統的行為, 則可以給予我們極大的幫助 2017/3/11 類神經網路與財務分析
研究目的 本研究預期達成的目標 利用不同的演算法,比較何者能取得較佳的預測能力 技術指標經主成分分析萃取過後,是否能達到較高的預測能力 比較預測模型應用於美國道瓊與台灣大盤,是否有所差異 2017/3/11 類神經網路與財務分析
研究方法 文獻探討 股票資料收集與整理 技術指標計算 資料正規化 資料排序 輸入值主成分分析 類神經模型分析 結果輸出 比較正確率 2017/3/11 類神經網路與財務分析
研究資料與所需軟體 研究資料 SPSS 17.0 NeuroSolution 5 Excel OS 美國道瓊:1993/02/15-2004/12/30,共2487筆 台灣大盤:1993/02/18-2010/01/20,共4442筆 SPSS 17.0 進行主成分分析,萃取出價量值較高的技術指標 NeuroSolution 5 建構類神經模型並輸出預測結果 Excel 進行預測值與實際值的準確率比較 OS Windows XP 2017/3/11 類神經網路與財務分析
二、文獻探討 類神經網路原理 類神經網路類型 類神經網路模型理論基礎 二、文獻探討 類神經網路原理 類神經網路類型 類神經網路模型理論基礎
類神經網路原理 人工神經元模型可用輸入值的加權乘積和之函數來表示: Xi:輸入變數,模仿生物神經元的輸入訊號 Yj = 輸出變數,模仿生物神經元的輸出訊號 f = 轉換函數,仿生物神經元的非線性處理機能 Wij = 連接加權值,模仿生物神經元的突觸強度 Θj = 門限值,模仿生物神經元的閥值又稱偏權值 圖1.大腦神經系統與人工網路系統(葉怡成,2004) 2017/3/11 類神經網路與財務分析
類神經網路類型 監督式學習網路(Supervised learning network) 多層感知網路(Multilayer Perception,MLP) 支援向量機(Support Vector Machine,SVM) 倒傳遞網路(Back-propagation Network,BPN) 機率神經網路(Probabilistic Neural Network,PNN) 學習向量量化網路(Learning Vector Quantization,LVQ) 遞迴網路(Recurrent Networks,RN) 2017/3/11 類神經網路與財務分析
類神經網路類型 非監督式學習網路(Unsupervised learning network) 自組織映射網路(Self-Organization Map, SOM) 自適應共振理論網路(Adaptive Resonance theory Network, ART) 聯想式學習網路(Associate learning network) 霍普菲爾網路(Hopfield Neural Network,HNN) 雙向聯想記憶網路(Bi-directional Associative Memory,BAM) 最適化應用網路(Optimization application network) 霍普菲爾-坦克網路(Hopfield-Tank Neural Network,HTN) 退火神經網路(Annealed Neural Network,ANN) 2017/3/11 類神經網路與財務分析
類神經網路模型理論基礎 多層感知網路(Multilayer Perception, MLP) 學習策略:監督式學習 網路架構:前向式架構 主要應用:診斷預測、樣本識別、分類問題、函數合成 主要特點:應用普遍、成功案例多、學習精度高、理論簡明 圖2.多層感知網路架構,每一層神經元間都有連繫關係的權重 2017/3/11 類神經網路與財務分析
類神經網路模型理論基礎 自組織特徵映射網路(Self-Organizing Feature Map Network, SOFM) 競爭式學習網路 學習策略:無監督式學習 網路架構:前向式架構 主要應用:聚類問題、拓樸映射 主要特點:具有鄰近區域觀念、學習速度快 圖3.自組織學習方式 2017/3/11 類神經網路與財務分析
類神經網路模型理論基礎 遞迴網路(Recurrent Network, RN) 學習策略:監督式學習 網路架構:回饋式架構 主要特點:非線性資料、預測與分析、最適化效果比SVM佳 主要應用:股市預測、機器人、自適應控制、時間序列 圖4.Multilayer Perception Network 與 Recurrent Network 2017/3/11 類神經網路與財務分析
類神經網路模型理論基礎 支援向量機(Support Vector Machine, SVM) 學習策略:監督式學習 網路架構:前向式架構 主要應用:廣泛的應用於統計分類以及回歸分析中 主要特點:同時最小化經驗誤差與最大化幾何邊緣區 2017/3/11 類神經網路與財務分析
三、研究方法 資料來源 技術指標 輸入與輸出變數 資料正規化 資料排序 三、研究方法 資料來源 技術指標 輸入與輸出變數 資料正規化 資料排序
資料來源 美國道瓊指數: 台灣股市大盤: 每筆資料包含當日開盤價、最高價、最低價、收盤價、成交量 訓練樣本共1987筆,1995/02/15~2003/01/06 測試樣本共500筆,2003/01/07~2004/12/30 台灣股市大盤: 每筆資料包含當日開盤價、最高價、最低價、收盤價 訓練樣本共3552筆,1993/02/18~2006/06/27 測試樣本共890筆,2006/06/28~2010/01/20 2017/3/11 類神經網路與財務分析
技術指標 (1)趨向指標(Durbin Watson, DW) (2)相對強弱指標(Relative Strength Indicator, RSI) 2017/3/11 類神經網路與財務分析
技術指標 (3)價量指標(Price Volume Indicator, PVI) (4)價量變化指標(Price Volume Change, PVC) 2017/3/11 類神經網路與財務分析
技術指標 (5)移動平均價指標(Moving Average Indicator, MAI) (6)移動平均量指標(Moving Volume Indicator, MVI) 2017/3/11 類神經網路與財務分析
技術指標 (7)正量指標(Positive Volume Index, PVI) 假如 今日成交量「大於」昨日成交量,則 今日PVI = 昨日 PVI + 今日股價漲跌幅 否則 今日PVI = 昨日 PVI + 0 (8)負向指標(Negative Volume Index, NVI) 假如 今日成交量「小於」昨日成交量,則 今日NVI = 昨日 NVI + 今日股價漲跌幅 今日NVI = 昨日 NVI + 0 2017/3/11 類神經網路與財務分析
輸入與輸出變數 道瓊輸入變數 台股輸入變數 輸出變數 DW5, DW10, DW20, DW30, RSI5, RSI10, RSI20, RSI30, PVI5, PVI10, PVI20, PVI30, PVC5, PVC10, PVC20, PVC30, MAI5_10, MAI5_20, MAI5_30, MAI10_20, MAI10_30, MAI20_30, MVI5_10, MVI5_20, MVI5_30, MVI10_20, MVI10_30, MVI20_30, PVI, NVI 共計30個輸變數 台股輸入變數 DW5, DW10, DW20, DW30, RSI5, RSI10, RSI20, RSI30, MAI5_10, MAI5_20, MAI5_30, MAI10_20, MAI10_30, MAI20_30, PVI, NVI 共計18個輸入變數 輸出變數 以明天的收盤價減開盤價做為計算: IF ( Close-Open ) > 0 Then “result” = 1 , Else “result” = 0 2017/3/11 類神經網路與財務分析
資料正規化 所有輸入變數,以標準差正規化: 2017/3/11 類神經網路與財務分析
資料排序 將道瓊指數的訓練樣本,依照以下方式排序 將台股資料依造上述方式進行排序 以每100筆資料為單位。 將1~100筆資料,依照「result」由大到小排序,此時,1~50筆約為「漲」,51~100筆約為「跌」。 將101~200筆資料,依照「result」由大到小排序,此時,101~150筆約為「漲」,151~200筆約為「跌」。 依造上述規則,對1987筆的訓練樣本進行排序。 500筆測試樣本不依照「result」排序,只依造時間序列排序。 將台股資料依造上述方式進行排序 2017/3/11 類神經網路與財務分析
四、實驗結果與分析 SPSS17.0主成分分析 NEUROSOLUTIONS5分析 EXCEL測試方法
SPSS17.0主成分分析:道瓊 30個輸入變數,最後萃取出18個輸入變數 「平方和負荷量萃取」達到94.795% 2017/3/11 類神經網路與財務分析
SPSS17.0主成分分析:台股 18個輸入變數,最後萃取出8個輸入變數 「平方和負荷量萃取」達到95.183% 2017/3/11 類神經網路與財務分析
NEUROSOLUTIONS5分析:道瓊-MLP 訓練樣本:1987筆 正確率:跌97.75%,漲98.30% C.V.測試:30 Folds 正確率:跌98.08%,漲97.86% 實際測試:500筆,正確率:100% 2017/3/11 類神經網路與財務分析
MICROSOFT OFFICE EXCEL測試方法 將測試樣本帶入已經訓練完成的類神經模型,並將結果匯出,欄位命名為「Out result」,數值為介於0~1之間的連續數 將「Out result」四捨五入為{0,1},Excel函數=ROUND(C2,0) 2017/3/11 類神經網路與財務分析
MICROSOFT OFFICE EXCEL測試方法 比較「result」與「四捨五入」是否相等,Excel函數=IF(B2=D2,"True","False") 將False顯示為1,Excel函數=IF(E2="False",1," ") 2017/3/11 類神經網路與財務分析
MICROSOFT OFFICE EXCEL測試方法 False計算次數,Excel函數=IF(F2=1,F2+G1,G1),G1初始值=0 2017/3/11 類神經網路與財務分析
MICROSOFT OFFICE EXCEL測試方法 計算總筆數「Total」,Excel函數=COUNT(D2:D891) 計算錯誤筆數「False」,Excel函數=COUNT(F2:F891) 計算正確筆數「True」,Excel函數=F892-F893 計算錯誤率,Excel函數=F893/F892*100 計算正確率,Excel函數=F894/F892*100 2017/3/11 類神經網路與財務分析
NEUROSOLUTIONS5分析:道瓊-SOFM 訓練樣本:1987筆 正確率:跌98.39%,漲98.43% C.V.測試:30 Folds 正確率:跌85.35%,漲97.86% 實際測試:500筆,正確率:54.4% 2017/3/11 類神經網路與財務分析
NEUROSOLUTIONS5分析:道瓊-RN 訓練樣本:1987筆 正確率:跌97.79%,漲98.28% C.V.測試:30 Folds 正確率:跌98.08%,漲97.86% 實際測試:500筆,正確率:100% 2017/3/11 類神經網路與財務分析
NEUROSOLUTIONS5分析:道瓊-SVM 訓練樣本:1987筆 正確率:跌100%,漲100% C.V.測試:30 Folds 正確率:跌98.72%,漲67.61% 實際測試:500筆,正確率:53.2% 2017/3/11 類神經網路與財務分析
NEUROSOLUTIONS5分析:台股-MLP 訓練樣本:3552筆 正確率:跌98.28%,漲97.66% C.V.測試:30 Folds 正確率:跌98.17%,漲97.61% 實際測試:890筆,正確率:100% 2017/3/11 類神經網路與財務分析
NEUROSOLUTIONS5分析:台股-SOFM 訓練樣本:3552筆 正確率:跌98.17%,漲97.63% C.V.測試:30 Folds 正確率:跌98.17%,漲97.61% 實際測試:890筆,正確率:76.7% 2017/3/11 類神經網路與財務分析
NEUROSOLUTIONS5分析:台股-RN 訓練樣本:3552筆 正確率:跌98.28%,漲97.66% C.V.測試:30 Folds 正確率:跌98.17%,漲97.61% 實際測試:890筆,正確率:100% 2017/3/11 類神經網路與財務分析
NEUROSOLUTIONS5分析:台股-SVM 訓練樣本:3552筆 正確率:跌100%,漲100% C.V.測試:30 Folds 正確率:跌79.96%,漲98.26% 實際測試:890筆,正確率:55.1% 2017/3/11 類神經網路與財務分析
五、結論
結論 綜合以上實驗結果,製作如下表格: 2017/3/11 類神經網路與財務分析 MLP SOFM RN SVM 跌 漲 道 瓊 訓練 97.75% 98.30% 98.39% 98.43% 97.79% 98.28% 100% C.V 98.08% 97.86% 85.35% 98.72% 67.61% 測試 正確筆數:500/500 正確率:100% 正確筆數:272/500 正確率:54.4% 正確筆數:266/500 正確率:53.2% 台 股 97.66% 98.17% 97.63% 97.61% 79.96% 98.26% 正確筆數:890/890 正確筆數:683/890 正確率:76.74% 正確筆數:490/890 正確率:55.05% 2017/3/11 類神經網路與財務分析
結論 訓練樣本經由排序過後,能有效提高預測的準確率, 未排序之前準確率約六成,排序過後準確率約九成。 技術指標經過萃取過後,確實能達到較高的預測能力, 未經萃取之前準確率約為八成,經由萃取過後準確率 約九成。 類神經預測模型應用於美國道瓊與台灣大盤,台灣股 市大盤預測的準確率略為準確。 MLP、SOFM、RN、SVM應用於美國道瓊指數與台灣股市 大盤,MLP與RN整體上擁有較佳的預測能力。 2017/3/11 類神經網路與財務分析
參考文獻 黃兆瑜、葉怡成、連立川,「遺傳神經網路股票決策系統的實證」,電子商務學報,第十卷, 第四期,第821-1040頁,2008 李沃牆與李建信,台指選擇權之評價-ANN與GANN模型之績效比較,真理財經學報,8,25-50頁, 2003 林耀堂,「遺傳程式規劃於股市擇時交易策略之應用」,國立中央大學資訊管理研究所碩士論 文,2001 胡克非,「應用多重類神經網路於基本面與技術面因素預測新台幣兌美元匯率」,國立交通大 學資訊管理研究所碩士論文,2007 柳鈞元,「應用自組織映射神經網路於外幣市場匯率動態評估系統設定」,國立交通大學資訊 管理研究所碩士論文,2008 黃閔淞,「應用自組織映射神經網路進行公司動態財務行為之體質檢定」,國立交通大學,資 訊管理研究所碩士論文,2008 楊景隆,「以自組織映射神經網路於TFT-LCD產業」,國立交通大學,資訊管理研究所碩士論 文,2009 劉克一,「以遺傳演算法演化類神經網路在股價預測上的應用」,真理大學管理科學研究所碩 士論文,2001 蔡宗憲,「運用長期記憶與ANFIS模型估計不同交易期間台灣股價指數之風險值」,國立台灣 科技大學資訊管理研究所碩士論文,2004 薛淑如,「應用類神經網路於股票價值之評估」,國立彰化師範大學會計學系碩士論文,2003 2017/3/11 類神經網路與財務分析