Data Mining 工具介紹 (Weka / R)

Slides:



Advertisements
Similar presentations
庄文忠 副教授 世新大学行政管理学系 2012/7/6 SPSS 之应用 ( 庄文忠副教授 ) 1 SPSS 的环境与基本操作.
Advertisements

Big Data Ecosystem – Hadoop Distribution
第五章 資訊科技基礎建設與新興科技.
SQL的简单查询.
数据分析及研究方法 ——以如何从事宏观经济课题研究为例
TALK ABOUT 数据挖掘-十大经典法 QianShi Li-Design
云计算业务应用-数据挖掘.
Oracle SQL Developer 中有哪些新增功能
转正述职报告 乐恩公司 史航
第十五章 常見的資料庫管理系統 目的 Oracle 微軟SQL Server 微軟Access MySQL Oracle 應用伺服器
臺北市立大學 資訊科學系(含碩士班) 賴阿福
程式設計概論 1.1 程式設計概論 程式語言的演進 物件導向程式 程式開發流程 1.2 C++開發工具
Supplement Data Mining 工具介紹 楊立偉教授 台灣大學工管系 2014 Fall 1.
Supplement Data Mining 工具介紹 楊立偉教授 台灣大學工管系 2015 Fall 1.
MIT App Inventor簡介及 「Hello World」程式初體驗 靜宜大學資管系 楊子青
JAVA vs. SQL Server 建國科技大學 資管系 饒瑞佶 2013/4 V1.
連結資料庫 ACCESS MSSQL.
作業系統 補充: 雲端運算.
Q101 在701 SDX Linux上的標準安裝與使用程序v2
JDK 安裝教學 (for Win7) Soochow University
Data Mining 工具介紹 (Weka+JDBC)
資料庫管理 操作DBMS 指導教授:楊維邦  助教:廖皓翔.
資料探勘-案例期末報告 SQL Server 2008 Analysis Service
Working with Databases (II) 靜宜大學資管系 楊子青
資料庫操作.
巨量資料分析與應用 (1) 楊立偉教授 台大工管系暨商研所 2014 Fall.
实验 2:MS Access QBE Query使用
Data Mining 工具介紹 (Weka/R + ODBC)
SSL-VPN 之登入及使用 資訊處 主講人.
R教學 安裝RStudio 羅琪老師.
Data Mining 資料探勘 Introduction to Data Mining Min-Yuh Day 戴敏育
常用資料採礦技術介紹 關聯分組(associations)、分類(classification)、時序相關(sequence)、預測(forecasting)、群集化(clustering)以及描述等分析作業,目前常用的資料採礦技術有決策樹、類神經網路、基因演算法以及即時線上分析(OLAP)
生 物 信 息 学 Bioinformatics 巩晶 癌症研究中心 山东大学 医学院
安裝JDK 安裝Eclipse Eclipse 中文化
自由軟體介紹(一) 把flash通通帶回家 報告人:陳俊銘.
Windoop操作步驟 於作業系統Windows 10 專業版.
Data Mining 第八組 B 萬佳育 B 葉書蘋.
Android App簡介及 App Inventor 2體驗 靜宜大學資管系 楊子青
圖形溝通大師 Microsoft Visio 2003
Data Mining 工具介紹 (Weka/R to MySQL)
Java程式設計 Eclipse.
物联网数据处理 第一讲 数据处理基本概念 刘进军 QQ:
App Inventor 2初體驗 靜宜大學資管系 楊子青
AOT_供應商安裝手冊.
VB2005 DataBase Manipulation Command for Access
常見的巨量資料分析與應用 楊立偉教授 台大工管系暨商研所 2018.
K/3 Cloud V6.0产品培训 -- 业务监控 K/3 Cloud 产品部
資料來源 2 網路過濾軟體之安裝說明 資料來源 2.
K/3 Cloud V6.1产品培训 -- 业务监控 K/3 Cloud 产品部
数据透视表与SQL典型应用 ——数据分析人士必杀技
Install OpenCV C++ with Visual Studio 2017 on Windows PC
GridView.
FTP使用教學 簡介: 軟體名稱:FileZilla 軟體性質:Freeware 版本: 繁體中文版
Ogive plot example 說明者:吳東陽 2003/10/10.
主讲人:黄鹤 副教授 Office:9-416 劳动关系与劳动政策 主讲人:黄鹤 副教授 Office:9-416.
雲端計算.
常見的巨量資料分析與應用 楊立偉教授 台大工管系暨商研所 2017.
Text To Speech (TTS, 文字轉 語音)、讀簡訊 靜宜大學資管系 楊子青
第九組報告 指導教授 : 林振緯 組員 : 資工四甲 曹又升 黃晏林 黃冠惟
電子郵件安全:如何防範社交工程郵件 圖書資訊服務處 元智大學.
文字和網站探勘 學習目標 說明文字探勘與了解文字探勘需求 分辨文字探勘與資料探勘 了解文字探勘的不同應用 了解執行文字探勘專案的流程
树立开放理念 强化管理水平 全面提升来华留学生教育工作水平
連結資料庫 MYSQL.
商業智慧實務 Practices of Business Intelligence
多變量統計分析 陳 宏 臺灣大學數學系 2/18/2009
大数据应用人才培养系列教材 R 语言 刘 鹏 张 燕 总主编 程显毅 主编 刘颖 朱倩 副主编.
大数据应用人才培养系列教材 数据挖掘基础 刘 鹏 张 燕 总主编 陶建辉 主编 姜才康 副主编.
Term Project : Requirement
第10章 網路問卷調查.
数据库应用技术 天津电大 翟迎建.
Presentation transcript:

Data Mining 工具介紹 (Weka / R) Supplement Data Mining 工具介紹 (Weka / R) 楊立偉教授 台灣大學工管系 2016 1

Data Mining 工具 The R Project for Statistical Computing http://www.r-project.org/ Weka : Data Mining Software in Java http://www.cs.waikato.ac.nz/ml/weka/ SAS Enterprise Miner (EM) Business Analytics and Business Intelligence Software IBM SPSS Predictive analytics software and solutions and others

Using Weka (1) 獨立下載安裝Java 7 (支援ODBC) 後再下載Weka,安裝或解壓縮後點weka.jar執行 http://www.oracle.com/technetwork/java/javase/downloads/jre7-downloads-1880261.html http://www.cs.waikato.ac.nz/ml/weka/downloading.html

Using Weka (2) 下載Access資料庫tennis.accdb,在ODBC新增來源名稱為tennis,供待會連接使用 啟動Weka後,點選Explorer

點選Open DB…URL輸入jdbc:odbc:tennis,點選連接符號;之後輸入SQL指令執行,若有資料表示成功 1 2 點選Open DB…URL輸入jdbc:odbc:tennis,點選連接符號;之後輸入SQL指令執行,若有資料表示成功 3 4 5

Using Weka (3) 可參考手冊 WekaManual.pdf 啟動Weka後,點選KnowledgeFlow

Using Weka (3) 選擇DataSources→DatabaseLoader 置放在工作區,選取後按右鍵選Configure…

輸入 jdbc:odbc:tennis SELECT outlook, temperature, humidity, windy, play FROM playtennis

Using Weka (4) 放置Evaluation→ClassAssigner,以及TrainingSetMaker 放置Classifiers→trees→J48 (即C4.5演算法之實作) 放置Visualization→TextViewer

Using Weka (5) 在DatabaseLoader按右鍵選dataSet到ClassAssigner 在ClassAssigner按右鍵選dataSet到TrainingSetMaker 在TrainingSetMaker按右鍵選trainingSet到J48 在J48按右鍵選text到TextViewer

Using Weka (6) 在ClassAssigner按右鍵選configure確認目標欄位是play 在DatabaseLoader按右鍵選Start loading 執行完畢,在TextViewer按右鍵選Show results看結果

Using Weka (7) Clustering 使用Simple Kmeans演算法,用TextViewer看結果 以k=3為例

Using Weka (8) Association 使用Apriori演算法,用TextViewer看結果 只能處理nominal value

Using Weka (9) Association 使用Apriori演算法結果如下 * 決策樹的每條path可能就是一條rule;可能會找到更多的rules

Using R with Database (1) 挑選CRAN(Comprehensive R Archive Network)中之站點,下載R安裝後執行 http://cran.csie.ntu.edu.tw/ 台大資工站點 選擇base版本下載,點擊安裝 之後執行R

Using R with Database (2) 安裝RODBC套件 選程式套件>安裝程式套件>挑選CRAN站點: 0-Cloud 選RODBC後即可 執行指令 library(RODBC) 載入該套件 c=odbcConnect(“tennis”) 開啟連線, 取名為c x=sqlFetch(c, “playtennis”) 從該來源取出某張表 或sqlQuery(c, “SELECT outlook, temperature, humidity, windy, play FROM playtennis”)

執行結果

Using R with Database (3) 安裝C50套件 選程式套件>安裝程式套件>挑選CRAN站點: 0-Cloud 選C50後即可 執行指令 library(C50) 載入該套件 m=C5.0(x[,2:5],x$play) 以第2~5欄做訓練,目標欄位為play summary(m)

執行結果

Using R with Database (4) 安裝arules套件 選程式套件>安裝程式套件>挑選CRAN站點: 0-Cloud 選arules後即可 執行指令 library(arules) 載入該套件 r=apriori(x[,2:6]) 以第2~6欄分析 rs=sort(r,by=“confidence”) 將結果排序 inspect(rs) 顯示結果

執行結果

執行結果