資料探勘-案例期末報告 SQL Server 2008 Analysis Service

資料探勘-案例期末報告 SQL Server 2008 Analysis Service
組別：第三組組員：吳致暉王雪蕙李承頴指導教授：李金鳳　教授報告日期：2014/01/09

目錄軟體公司簡介軟體工具簡介軟體應用案例軟體實作結果軟體優缺 Classification Clustering
Association Rule 軟體優缺

軟體公司簡介公司名稱： Microsoft 主要領導人：史帝夫.包爾默 (Steve Ballmer)，執行長
凱文.特納 (Kevin Turner)，營運長簡介微軟公司成立於 1975 年，多年來在全球個人電腦與商用軟體、服務與網際網路技術上居領導地位。奠基於 30 年在硬體上的專業經驗，微軟現今轉型為提供裝置與雲端服務 (Devices and Services) 的公司。全球員工總人數約 99,139 人，員工遍布於超過 190 個國家。圖片來源：

軟體工具簡介工具名稱：SQL Server 2008 Analysis Service 簡介
提供各式各樣的方案來建立及部署分析資料庫，任何 Analysis Services 方案的基礎都是商業智慧語意資料模型和伺服器執行個體，此執行個體會具現化、處理、查詢及管理該模型中的物件。 Download網址官方Microsoft下載中心圖片來源：

軟體應用案例-中華電信中華電信於民國 85 年由交通部電信總局營運部門改制成立。其主要業務涵蓋固網通信、行動通信、數據通信等三大領域，為國內營運經驗最豐富、規模最大之綜合電信業者。提供語音服務、專線電路、網際網路、寬頻上網、智慧型網路、虛擬網路、電子商務、企業整合服務，以及各類加值服務。資料參考自中華電信網站

軟體應用案例-中華電信案例介紹中華電信的核心資料倉儲 EDW (Enterprise Data Warehouse) 彙整了大量資料，需要採用高效能的Teradata 。進行系統效能考量後，中華電信認為可採用IBM 的 DB2 或微軟的 SQL Server，最後中華電信採用SQL Server 。商業智能的目的是幫助決策者制定消息靈通的選擇。因此，現代商業智能係統必須能處理海量的、詳細的、全異的數據并快速將其轉化為有意義的、準確、決策者可以放心執行的信息資料來源: Microsoft SQL Server 2008：成功案例

軟體應用案例-中華電信導入後效益建置成本低:與他廠產品相較之下，建置成本也低很多，同時也兼顧到管理層面。
易維護:資料庫的管理方面很輕鬆，就不必去雇用一個高薪的資料庫管理員。高普及率:SQL 系統在一般業界被使用的普及率也比較高。資料來源: Microsoft SQL Server 2008：成功案例

Classification

軟體實作結果-Classification
步驟一先建立一新的採礦結構

步驟二選擇分析資料來源＞現有的關聯式資料庫或資料倉儲。

步驟三選擇採礦技術>Microsoft 決策樹。

步驟四選取分析的資料來源。

步驟五設定採礦分析所使用的資料表[案例/巢狀]。

步驟六設定索引鍵、可預測值、輸入值

步驟七檢視與設定分析資料的內容類型與資料類型

步驟八設定測試資料的百分比、測試資料及內的最大案例數目。

步驟九定義採礦結構名稱。定義採礦模型

步驟十開啟「採礦結構」，選擇採礦模型。在演算方法上右鍵>處理模型

步驟十一點選「執行」開始處理模型。

模型結果

Clustering

軟體實作結果-Clustering 步驟一先建立一新的採礦結構步驟二選擇分析資料來源＞現有的關聯式資料庫或資料倉儲。步驟三
選擇採礦技術>Microsoft 群集。

軟體實作結果-Clustering 步驟四選取分析的資料來源。

軟體實作結果-Clustering 步驟五設定採礦分析所使用的資料表[案例/巢狀]。

軟體實作結果-Clustering 步驟六設定索引鍵及輸入值。而群集演算法不需要設定「可預測變數」

軟體實作結果-Clustering 步驟七檢視與設定分析資料的內容類型與資料類型

軟體實作結果-Clustering 步驟八群集演算法不需要測試組資料，故測試集資料的比例設0%。

軟體實作結果-Clustering 步驟九步驟十步驟十一定義採礦結構名稱。定義採礦模型名稱。開啟「採礦結構」，選擇採礦模型。
在演算方法上右鍵>處理模型步驟十一點選「執行」開始處理模型。

軟體實作結果-Clustering 模型結果

Association Rule

軟體實作結果-Association Rule
步驟一先建立一新的採礦結構步驟二選擇分析資料來源＞現有的關聯式資料庫或資料倉儲。步驟三選擇採礦技術>Microsoft 關聯規則。

步驟四選取分析的資料來源。

步驟五設定採礦分析所使用的資料表[案例/巢狀] 關聯規則購物籃主檔[案例]；購物籃產品明細[巢狀];

步驟六明細檔肩負輸入與可預測，故兩者皆要勾選。

步驟七檢視與設定分析資料的內容類型與資料類型

步驟八關聯規則是非監督式學習，所以不需要設定測試組資料。

步驟九定義採礦結構名稱。定義採礦模型名稱。步驟十開啟「採礦結構」，選擇採礦模型。在演算方法上右鍵>處理模型步驟十一點選「執行」開始處理模型。

模型結果

軟體使用優缺-Classification
設定分析資料欄位時，軟體提供使用者可採用那些欄位當作輸入。

軟體使用優缺優軟體提供多個分析演算法，設定後可以相互比較其分析結果的優劣，或者較符合使用者需求。
Classification(Entropy) Clustering(K-means不可擴充)

軟體使用優缺缺：因設定參數很多，會需要一直刷新資料，對於資料量大時，需花費較多時間。
有許多參數可以設定，通常也有給予預設值，間單的操作後即可有結果，但若要深究，會不知道如何去做分析與解釋。

Thank you for your listening!

資料探勘-案例期末報告 SQL Server 2008 Analysis Service

Similar presentations

Presentation on theme: "資料探勘-案例期末報告 SQL Server 2008 Analysis Service"— Presentation transcript:

Similar presentations

About project

反馈

请登录

Auth with social network:

資料探勘-案例期末報告 SQL Server 2008 Analysis Service

Similar presentations

Presentation on theme: "資料探勘-案例期末報告 SQL Server 2008 Analysis Service"— Presentation transcript:

Similar presentations

About project

反馈