指導教授:陳牧言 老師 學生:資管四1 謝鎧宇、黃俊憲 類神經大盤股市分析系統 指導教授:陳牧言 老師 學生:資管四1 謝鎧宇、黃俊憲
大綱 緒論 文獻探討 研究方法 實驗結果與分析 結論 參考文獻
一、緒論 研究動機 研究目的 研究方法 研究資料與所需軟體
研究動機 因為股票一直都是大家喜愛投資的,不管男女老少都很愛投資,所以我們將利用類神經網路對股票市場做分析,用來判斷股票市場的漲跌,試著讓投資股票可以獲利。
研究目的 因股票市場各方面因素皆會影響股票的漲跌,在此我們使用類神經網路希望能讓股票市場漲跌預測更加準確,在投資股票時能夠獲利,是此次的研究目的。
預期達成目的 將技術指標萃取後,用多種遺傳神經網路,比較各個網路取得較佳的預測結果。 再將較佳的類神經模型應用在台灣大盤股市,觀察預測結果。 最後使用Microsoft Office Excel 2003 和 NeuroSolution 5 架設大盤股市分析系統。
研究資料與所需軟體 研究資料為台灣大盤股市:1993/02/18-2009/11/23 採用SPSS17.0進行主成分分析,萃取出價量值較高的技術指標。(往後章節會提到) 採用PC NeuroSolution 5 與XP 與Microsoft Office Excel 2003 來架設類神經網路
二、文獻探討 類神經網路原理
類神經網路原理 上面是一張類神經網路的圖。類神經網路模擬人類的大腦,圓圈代表神經元,箭頭代表神經連結。類神經網路就是經由左邊的輸入,以及中間神經鍵結強度的調整,來學習如何產生右邊的輸出。學習後的類神經網路,就能夠對不同的輸入,產生正確的輸出了。
三、研究方法 系統架構 資料收集:台灣大盤:1993/02/18-2009/11/23 技術指標計算:DW、RSI、PVI、PVC、MAI、MVI、PVI、NVI 正規化:標準差正規化 資料排序:每50筆為單位,進行排序 主成分分析:SPSS17.0主成分分析,萃取出全重值最佳指標 軟體分析:NeuroSolution5(將各個類神經採用黑箱作業預測) 結果輸出 比較正確率:採用最新資料作為收集來預測實際。
資料來源 台灣股市: 每筆資料包含當日開盤價(Open)、最高價(High)、最低價(Low)、收盤價(Close) 以8:2的切割方式分為訓練樣本與測試樣本 1993/02/18~2006/05/12 共3521筆作為訓練樣本 2006/05/13~2009/11/24 共880筆作為測試樣本
技術指標 (1)趨向指標(Durbin Watson, DW) (2)相對強弱指標(Relative Strength Indicator, RSI)
技術指標 (3)價量指標(Price Volume Indicator, PVI) (4)價量變化指標(Price Volume Change, PVC)
技術指標 (5)移動平均價指標(Moving Average Indicator, MAI) (6)移動平均量指標(Moving Volume Indicator, MVI)
技術指標 (7)正量指標(Positive Volume Index, PVI) 假如今日成交量「大於」昨日成交量則 今日PVI = 昨日 PVI + 今日股價漲跌幅 否則 今日PVI = 昨日 PVI + 0 (8)負向指標(Negative Volume Index, NVI) 假如今日成交量「小於」昨日成交量,則 今日NVI = 昨日 NVI + 今日股價漲跌幅 否則 今日NVI = 昨日 NVI + 0
輸入、輸出變數 輸入變數 台股輸入變數: 共計16個輸入變數。 輸出變數 以明天的收盤價減今日收盤價做為計算: DW5, DW10, DW20, DW30 RSI5, RSI10, RSI20, RSI30 MAI5_10, MAI5_20, MAI5_30, MAI10_20, MAI10_30, MAI20_30 PVI NVI 共計16個輸入變數。 輸出變數 以明天的收盤價減今日收盤價做為計算: IF ( Tomorrow Close- Today Close ) > 0 Then “result” = 1 , Else “result” = 0
資料正規化 所有輸入變數,以標準差正規化:
資料排序 (1)將台股指數的訓練樣本,依照以下方式排序: 以每50筆資料為單位 將1~50筆資料,依照「result」由大到小排序,此時,1~50筆為排序過後的資料。 將51~100筆資料,依照「result」由大到小排序,此時,51~100筆為排序過後的資料。 依造上述規則,對訓練樣本進行排序。
四、實驗結果與分析 SPSS17.0主成分分析: NeuroSolutions5分析 NeuroSolutions5分析:MLP NeuroSolutions5分析:SOFM NeuroSolutions5分析:RN NeuroSolutions5分析:SVM
SPSS17.0主成分分析: 將台股數據的16個輸入變數,利用SPSS 17.0進行主成分分析 最後萃取出9個輸入變數 RSI10 MAI5_10, MAI5_20, MAI5_30, MAI10_20, MAI10_30, MAI20_30 ,PVI, NVI 使得「平方和負荷量萃取」達到94.077%
SPSS17.0主成分分析:
NeuroSolutions5分析 將各類神經分為五項測試 CV測試分為30組↓ 訓練樣本:測試樣本為8:2測試↓ 監督式學習(prediction delta=1) 非監督式學習(prediction delta=0) 訓練樣本:測試樣本為8:2測試↓ NeuroSolutions5 EXCEL 測試
類神經MLP CV測試分為30組 監督式學習(prediction delta=1) 非監督式學習(prediction delta=0)
類神經MLP 訓練:測試為8:2 監督式學習(prediction delta=1) 非監督式學習(prediction delta=0)
類神經MLP 訓練:測試為8:2(EXCEL)
類神經SOFM CV測試分為30組 監督式學習(prediction delta=1) 非監督式學習(prediction delta=0)
類神經SOFM 訓練:測試為8:2 監督式學習(prediction delta=1) 非監督式學習(prediction delta=0)
類神經SOFM 訓練:測試為8:2(EXCEL)
類神經RN CV測試分為30組 監督式學習(prediction delta=1) 非監督式學習(prediction delta=0)
類神經RN 訓練:測試為8:2 監督式學習(prediction delta=1) 非監督式學習(prediction delta=0)
類神經RN 訓練:測試為8:2(EXCEL)
類神經SVM CV測試分為30組 監督式學習(prediction delta=1) 非監督式學習(prediction delta=0)
類神經SVM 訓練:測試為8:2 監督式學習(prediction delta=1) 非監督式學習(prediction delta=0)
類神經SVM 訓練:測試為8:2(EXCEL)
NeuroSolutions5分析 最後將此20個類神經預測最新一個月(四月)的股市資料!發現 SVM-1-C 100% SOFM-0-C 61% RN-1-T 100% MLP-1-T 100% MLP-1-C 100% 為有效之類神經預測
五、結論 最後將資料一筆一筆的比對明天會漲會跌!則發現監督式學習會產生神經比對輸出值之謬誤。 則發現SOFM-0-C 61%為目前之研究較準的情況。
參考文獻 黃兆瑜、葉怡成、連立川(2008),「遺傳神經網路股票決策系統的實證」,電子商務學報,第十卷,第四期,第821-1040頁。 人工智慧與機器學習 http://mmdays.wordpress.com/2007/05/03/ai/