企業入口網站(EIP)/ 應用系統(ERP, SCM, CRM) 第八章 e化企業新的IT架構 3. 分析層 使用層 企業入口網站(EIP)/ 應用系統(ERP, SCM, CRM) Chap 10.9 Chap 10,11,12 分析層 線上分析處理 資料探勘 智慧代理人 Chap 8.5 Chap 8.6 Chap 8.8.1 資料倉儲 資料超市 Chap 8.4 儲存層 資料庫 Chap 附錄8-A 傳遞與蒐集層 網際網路 企業內部網路 企業外部網路 Chap 8.2.1 Chap 8.2.2
3.1 線上分析處理 On-line Analytical Processing (OLAP) 架構在資料倉儲上,提供使用者多維度、多角度的快速分析 由於資料倉儲的架構經過重新設計,並採新的索引技術,可同時提供多個使用者在線上做即時的分析查詢 讓大部份的使用者不須仰賴資訊人員(傳統資料庫需使用SQL),只要用交談式分析工具,就能從事線上分析。
OLAP主要提供的多維度分析功能 切片(Slice) 把資料視為一個立方體,將之切成薄薄的一片。 可將三維資料切成二維資料以取得較彙整、較宏觀的資料。 產品 通路 電冰箱 電視機 錄影機 收音機 零售商 量販店 直銷 100 200 300 400 1000 700 1997 1998 1999 年 Ex: 如右圖,假設時間固定在1997年,則切片後僅剩該年度產品與通路二個維度之關係
OLAP主要提供的多維度分析功能 (Cont.) 切丁(Dice) 從一個大骰子(所有產品、所有時間、所有通路)切出一個範圍較小、維度相同的小骰子(某一產品、某一時間、某一通路) 產品 通路 電冰箱 電視機 錄影機 收音機 零售商 量販店 直銷 100 200 300 400 1000 700 1997 1998 1999 年 Ex: 如右圖,查詢1997年與1998年,零售商的電冰箱銷售量
OLAP主要提供的多維度分析功能 (Cont.) 下拉 (Drill Down) 由宏觀到微觀的角度觀察資料,例如從年度銷售額往下拉到季,再往下拉到週,再往下拉到日。 上轉 (Roll Up) 與下拉相反,例如從日的資料往上整合轉到週,再由週往上轉到季。
OLAP主要提供的多維度分析功能 (Cont.) 旋轉 (Rotation) 考慮不同的管理者常有不同的資訊需求,如骰子般旋轉之後會改變維度的角度 如下圖,若骰子向左旋轉,從原來的產品與通路將變成產品與時間。 產品 通路 電冰箱 電視機 錄影機 收音機 零售商 量販店 直銷 100 200 300 400 1000 700 1997 1998 1999 年
3.2 資料探勘 Data Mining (DM) 利用統計、人工智慧(AI)或其他的分析技術,在企業之大型資料庫(或倉儲)內尋找與挖掘事前未知、有效且可付諸行動的資料間隱藏的關係與規則,用來指導企業的決策制定。
資料探勘的主要技術 (1) 關聯法則分析(另翻為聯結分析) Association Rule Analysis 在大型資料庫中,找出項目同時出現的關聯性 例如:哪些商品會使顧客一起購買?
關聯法則分析實例 假設原始交易如下表 (欲找最小support為2之關聯法則) → Large 1-itemset
關聯法則分析實例 (Cont.) →Large 2-itemsets →Large 3-itemsets
資料探勘的主要技術 (2) 循序樣式分析(另翻為次序相關分析) Sequential Pattern Analysis 找出變數與變數間,事件隨時間而聯結的關係 例如哪些貨品之買賣有先後順序 目的:由一群有時間次序性的交易中,找出經常出現的交易項目組合,進而瞭解顧客的長期購買行為。
循序樣式分析實例 假設以下為顧客之購買資料 (Support設為2) 循序樣式分析之結果: <{30},{40}> <{30},{70}> <{30},{40,70}> <{30},{90}> 顧客代號 交易時間 購買產品 1 2003.4.25. 2003.4.30 30 90 2 2003.4.10. 2003.4.15. 2003.4.20 10,20 40,60,70 顧客代號 交易時間 購買產品 3 2003.4.25. 30,50,70 4 2003.4.30. 2003.5.02 30 40,70 90 5 2003.4.12.
資料探勘的主要技術 (3) 分類分析 Classification Analysis 從已知類別的物件集合中,依據其屬性(可能影響物件類別的變數),建立一個分類模式(如決策樹或決策法則)來描述物件屬性與類別之關係。
分類分析 實例
ID3演算法 天氣 晴天 陰天 雨天 P 溼度 高 普通 N 多風 是 否
資料探勘的主要技術 (4) 群集分析 Clustering Analysis 設定一組由多個屬性描述其特性的物件集合,根據物件間的相似性,將這些物件分成群集,使得每個群集內的成員具有高度的相似性,而不同群集間之物件具有高度的不相似性。
群集分析 K-means演算法 選擇所要分成的集群數k,接著隨機選擇k個種子(seeds)做為每個集群的初始重心(means)。 計算每筆資料到重心的距離,將各筆資料分配到其最近的重心之集群內。 分配完畢後,再計算每個集群的新重心。 如此反覆進行分配集群及重新計算新重心的過程,直到新舊重心的位置不再改變為止。
資料探勘的主要技術 (5) 預測分析 Forecasting Analysis 以歷史資料來預測未來的走向 例如根據過去資料,未來10個月企業產品的銷售成長率如何。
DM在企業之應用實例 市場區隔 顧客流失 市場購物籃分析(Market Basket) 找出會購買相同產品顧客的共通特性。 預測哪些顧客可能會流失到其他競爭者。 市場購物籃分析(Market Basket) 找出消費者會同時購買的產品或服務。
3.3 智慧代理人 Intelligent Agents (IA) 被設計來幫助使用者完成某些特定目的及任務的一些軟體程式,其本身具有某種程度的智慧、知識與獨立自主性。
IA的主要功能 資訊的瀏覽與擷取 記憶使用者的瀏覽習慣,主動提供類似網站 Intelligent Indexing Agent: 自動scan文件,並將 主題、關鍵字與內容存起來且附加index 例如Spider搜尋引擎 Web-Browsing Agent: 網站導遊 例如Letizia根據使用者的瀏覽習慣,主動 提出其有興趣的相關網站
IA的主要功能(Cont.) 決策支援與強化員工 重複費時的行政作業 提醒、建議使用者更好的工作方式 E-mail Agent 例如Ginko可觀察、記錄、比較員工工作流程執行之績效,而建議最有效的方式 重複費時的行政作業 E-mail Agent 常用問題集(FAQ) Agent
IA的主要功能(Cont.) 個人例行任務的支援 資訊的搜尋、擷取、篩選及傳送。 專家的任務 例如定機票、會議排程等 電子商務方面的搜尋、比價與議價 例如Bargainfinder: 詢問線上商店關於使用者有興趣之特定CD的價格,以進行比價 專家的任務 例如User-Interface Agent: 輔助介面操作
表8-1 e化企業新型IT架構的支援目標與所使用的科技