Download presentation
Presentation is loading. Please wait.
1
資料探勘-案例期末報告 SQL Server 2008 Analysis Service
組別:第三組 組員: 吳致暉 王雪蕙 李承頴 指導教授:李金鳳 教授 報告日期:2014/01/09
2
目錄 軟體公司簡介 軟體工具簡介 軟體應用案例 軟體實作結果 軟體優缺 Classification Clustering
Association Rule 軟體優缺
3
軟體公司簡介 公司名稱: Microsoft 主要領導人: 史帝夫.包爾默 (Steve Ballmer),執行長
凱文.特納 (Kevin Turner),營運長 簡介 微軟公司成立於 1975 年,多年來在全球個人電腦與商用軟體、服務與網際網路技術上居領導地位。奠基於 30 年在硬體上的專業經驗,微軟現今轉型為提供裝置與雲端服務 (Devices and Services) 的公司。全球員工總人數約 99,139 人,員工遍布於超過 190 個國家。 圖片來源:
4
軟體工具簡介 工具名稱:SQL Server 2008 Analysis Service 簡介
提供各式各樣的方案來建立及部署分析資料庫,任何 Analysis Services 方案的基礎都是商業智慧語意資料模型和伺服器執行個體,此執行個體會具現化、處理、查詢及管理該模型中的物件。 Download網址 官方Microsoft下載中心 圖片來源:
5
軟體應用案例-中華電信 中華電信 於民國 85 年由交通部電信總局營運部門改制成立。其主要業務涵蓋固網通信、行動通信、數據通信等三大領域,為國內營運經驗最豐富、規模最大之綜合電信業者。 提供語音服務、專線電路、網際網路、寬頻上網、智慧型網路、虛擬網路、電子商務、企業整合服務,以及各類加值服務。 資料參考自 中華電信網站
6
軟體應用案例-中華電信 案例介紹 中華電信的核心資料倉儲 EDW (Enterprise Data Warehouse) 彙整了大量資料,需要採用高效能的Teradata 。 進行系統效能考量後,中華電信認為可採用IBM 的 DB2 或 微軟的 SQL Server,最後中華電信採用SQL Server 。 商業智能的目的是幫助決策者制定消息靈通的選擇。因此,現代商業智能係統必須能處理海量的、詳細的、全異的數據并快速將其轉化為有意義的、準確、決策者可以放心執行的信息 資料來源: Microsoft SQL Server 2008:成功案例
7
軟體應用案例-中華電信 導入後效益 建置成本低:與他廠產品相較之下,建置成本也低很多,同時也兼顧到管理層面。
易維護:資料庫的管理方面很輕鬆,就不必去雇用一個高薪的資料庫管理員。 高普及率:SQL 系統在一般業界被使用的普及率也比較高。 資料來源: Microsoft SQL Server 2008:成功案例
8
Classification
9
軟體實作結果-Classification
步驟一 先建立一新的採礦結構
10
軟體實作結果-Classification
步驟二 選擇分析資料來源>現有的關聯式資料庫或資料倉儲。
11
軟體實作結果-Classification
步驟三 選擇採礦技術>Microsoft 決策樹。
12
軟體實作結果-Classification
步驟四 選取分析的資料來源。
13
軟體實作結果-Classification
步驟五 設定採礦分析所使用的資料表[案例/巢狀]。
14
軟體實作結果-Classification
步驟六 設定索引鍵、可預測值、輸入值
15
軟體實作結果-Classification
步驟七 檢視與設定分析資料的 內容類型與資料類型
16
軟體實作結果-Classification
步驟八 設定測試資料的百分比、測試資料及內的最大案例數目。
17
軟體實作結果-Classification
步驟九 定義採礦結構 名稱。 定義採礦模型
18
軟體實作結果-Classification
步驟十 開啟「採礦結構」,選擇採礦模型。 在演算方法上 右鍵>處理模型
19
軟體實作結果-Classification
步驟十一 點選「執行」開始 處理模型。
20
軟體實作結果-Classification
模型結果
21
Clustering
22
軟體實作結果-Clustering 步驟一 先建立一新的採礦結構 步驟二 選擇分析資料來源>現有的關聯式資料庫或資料倉儲。 步驟三
選擇採礦技術>Microsoft 群集。
23
軟體實作結果-Clustering 步驟四 選取分析的資料來源。
24
軟體實作結果-Clustering 步驟五 設定採礦分析所使用的資料表[案例/巢狀]。
25
軟體實作結果-Clustering 步驟六 設定索引鍵 及輸入值。而群集演算法不需要設定「可預測變數」
26
軟體實作結果-Clustering 步驟七 檢視與設定分析資料的 內容類型與資料類型
27
軟體實作結果-Clustering 步驟八 群集演算法不需要測試組資料,故測試集資料的比例設0%。
28
軟體實作結果-Clustering 步驟九 步驟十 步驟十一 定義採礦結構名稱。 定義採礦模型名稱。 開啟「採礦結構」,選擇採礦模型。
在演算方法上 右鍵>處理模型 步驟十一 點選「執行」開始 處理模型。
29
軟體實作結果-Clustering 模型結果
30
Association Rule
31
軟體實作結果-Association Rule
步驟一 先建立一新的採礦結構 步驟二 選擇分析資料來源>現有的關聯式資料庫或資料倉儲。 步驟三 選擇採礦技術>Microsoft 關聯規則。
32
軟體實作結果-Association Rule
步驟四 選取分析的資料來源。
33
軟體實作結果-Association Rule
步驟五 設定採礦分析所使用的資料表[案例/巢狀] 關聯規則購物籃主檔[案例]; 購物籃產品明細[巢狀];
34
軟體實作結果-Association Rule
步驟六 明細檔肩負輸入與 可預測,故兩者皆 要勾選。
35
軟體實作結果-Association Rule
步驟七 檢視與設定分析資料的 內容類型與資料類型
36
軟體實作結果-Association Rule
步驟八 關聯規則是非監督式學習,所以不需要設定測試組資料。
37
軟體實作結果-Association Rule
步驟九 定義採礦結構名稱。 定義採礦模型名稱。 步驟十 開啟「採礦結構」,選擇採礦模型。 在演算方法上 右鍵>處理模型 步驟十一 點選「執行」開始 處理模型。
38
軟體實作結果-Association Rule
模型結果
39
軟體使用優缺-Classification
設定分析資料欄位時,軟體提供使用者可採用那些欄位當作輸入。
40
軟體使用優缺 優 軟體提供多個分析演算法,設定後可以相互比較其分析結果的優劣,或者較符合使用者需求。
Classification(Entropy) Clustering(K-means不可擴充)
41
軟體使用優缺 缺: 因設定參數很多,會需要一直刷新資料,對於資料量大時,需花費較多時間。
有許多參數可以設定,通常也有給予預設值,間單的操作後即可有結果,但若要深究,會不知道如何去做分析與解釋。
42
Thank you for your listening!
Similar presentations