OLAP is Online Analytical Processing
大綱 OLAP的定義 OLAP的定位 OLAP的幾項特性 OLAP的主要觀念 OLAP資料儲存的選擇性 OLAP的種類 總結
一、定義 OLAP線上分析處理系統是一個用來幫助使用者能有效率,並且有效的輕易完成商業資訊的維面結構分析工作。
二、定位
三、特性 快速性(fast) 分析性(analysis) 共享性(shared) 多維面(multidimensional) 資訊化(information)
四、OLAP之主要觀念 在線上分析處理資料模型中,資料是以立方(Cubes)來表示,其中主要包含了。 1.維度(Dimension):是一敘述性項目, 如時間、地點、產品、部門等。 2.量度(Measure):是一計量化的項目,如銷售金額、銷售數量、存貨量、銷售收入等。
維度(Dimension):年、客戶、部門等 量度(Measure):銷售金額、銷售數量等 逐層分析(Drill Down)、交叉分析(Slice and Dice),將原始資料加值為有意義的資訊
五、多維度分析 在線上分析處理資料模型的每個維度(Dimension)中,資料可以組織成階層式的觀念。 在每個維度階層中都會有其分析過後的數值,使用者可以用很簡單方式在這些維面階層中移動來看各階層的分析數值。
六、資料儲存的選擇性 在OLAP多維面的分析中,cubes、dimension、hierarchies 以及 measures 都是其必要的項目。 OLAP的主要功用是能使許多使用者可以在查詢同一時間的資料時能得到相同的結果。
七、OLAP的種類 MOLAP:應用於非關聯性資料庫 特色:1.Multidimensional OLAP 2.Cube存放在多維度資料庫Server端 3.事先做彙總運算並把結果寫入Cube 優點:1.最佳查詢效率 2.可處理複雜運算功能 3.最適合Web Base 缺點:需大量的儲存容量
ROLAP:應用於關聯性資料庫 特色:1.資料直接儲存於關聯性資料庫 2.不需事先做運算 優點:1.超大規模資料 2.可大規模隨性查詢 缺點:1.查詢效率很差 2.維護成本高
DOLAP 特色:1.Cube可直接儲存在Client PC端 2.事先做彙總運算並把結果寫入 Cube 優點:1.最佳查詢效率 2.建置成本低 缺點:1.有資料量的限制 2.有User數的限制
八、案例 SAS公司發展出一套多維度線上分析系統
九、SMART OLAP 特點: MDDB 檔案結構:解決大量資料時速度之瓶頸。 動態多維度分析:任意組合篩選各個維度,進行分析。 重點資料傳遞:將分析之異常或重點資料顯著標示並快速傳遞。
十、SMART OLAP 功能說明: SAS MDDB (Multi-Dimensional Data Base,多維度資料庫) Server 是 SAS 公司整個決策管理架構中的一個重要檔案結構。此種用在線上分析處理的檔案結構讓使用者能迅速地從不同的角度,由縱切面與橫切面來分析大量的彙總資料,做複雜的多維度分析與資訊報告。
十一、SAS MDDB的特性: 快速的分析查詢能力 SAS MDDB 屬於 MOLAP(Multidimensional OLAP),能夠快速地在大量資料下作 OLAP 分析,讓使用者得心應手。
有效使用儲存空間 一般多維度資料庫在建置時,各維度項目所交集的地方會留有儲存資料的空間,不管這交會點的資料存在與否。這樣會造成多維度檔案的虛胖與整個資料的存放會產生稀疏(Sparsity)的狀況而影響其效率。SAS MDDB 提供非常好的方法來處理這個問題,SAS MDDB 只儲存 non-missing 的資料。
動態多維度分析 一旦 MDDB 建置完成後,使用者除了可以任意的選取及組合分析的維度、維度裏的項目、看資料的順序、分析變數與統計值外,還可以做加總、排行與分析變數間的計算。
讀取詳細資料 當使用者在多維度資料庫裏分析到某一層次時,經常會有要到交易性資料做更進一步分析的需求。SAS MDDB 可以動態產生 SQL 透過 ODBC 或直接讀取詳細的資料。
結合SAS其他分析軟體 使用者查詢 SAS MDDB 的結果可以直接儲存成 SAS Data Set,利用 SAS 其他分析軟體作更進一步的分析。
資訊傳遞 使用者查詢 SAS MDDB 的結果除了可以直接儲存成MS Excel 試算表的格式外,還可以直接產生 HTML 格式的報表或繪成統計圖形並轉成 GIF 檔上網展示或直接 E-mail出去,資訊傳遞無遠弗屆。
十二、結語 OLAP未來將朝向及時處理的能力,因為現在進行多維空間的轉換仍相當耗時(平均需要十二個小時以上)。