Data Mining 工具介紹 (Weka+JDBC)

Slides:



Advertisements
Similar presentations
庄文忠 副教授 世新大学行政管理学系 2012/7/6 SPSS 之应用 ( 庄文忠副教授 ) 1 SPSS 的环境与基本操作.
Advertisements

第 7 章 数据库 1. Overview  数据库概述  数据库管理系统  数据库的体系结构和数据库模型  SQL 语言  数据库技术  构建数据库系统 2.
IT运维管理解决方案 -轻松管理,自在运维 产品经理 刘曜.
第1章 Java语言概述.
以創意陀螺設計競賽活動探究學童科 學創意、智商與學業成就之相關研究
Big Data Ecosystem – Hadoop Distribution
数据分析及研究方法 ——以如何从事宏观经济课题研究为例
資料庫系統 曾俊雄.
配合< JSP程序设计>例子源代码一起使用
TALK ABOUT 数据挖掘-十大经典法 QianShi Li-Design
第1讲 SPSS基础
第六章 数据库和ADO.NET 褚龙现 软件学院.
云计算业务应用-数据挖掘.
Oracle SQL Developer 中有哪些新增功能
第 11 章 網際網路與資料庫系統.
数据库概述 简而言之,数据库(DataBase)就是一个存储数据的仓库。为了方便数据的存储和管理,它将数据按照特定的规律存储在磁盘上。通过数据库管理系统,可以有效的组织和管理存储在数据库中的数据。如今,已经存在了Oracle、SQL Server、MySQL等诸多优秀的数据库。在这一章中将讲解的内容包括。
MySQL資料庫安全管理.
手持裝置應用系統之設計 與未來發展 黃有評 大同大學 資訊工程系.
转正述职报告 乐恩公司 史航
臺北市立松山家商 103學年度第1學期 學校日 教學說明 簡報
数据库应用与程序设计.
Made by Feng Nie 开源机器学习库&Hadoop介绍 Made by Feng Nie
J2EE与中间件技术 ——Lab.
第十五章 常見的資料庫管理系統 目的 Oracle 微軟SQL Server 微軟Access MySQL Oracle 應用伺服器
IBM DB2 Personal Edition 試用報告
安裝JDK 安裝Eclipse Eclipse 中文化
Supplement Data Mining 工具介紹 楊立偉教授 台灣大學工管系 2014 Fall 1.
Supplement Data Mining 工具介紹 楊立偉教授 台灣大學工管系 2015 Fall 1.
基于Hadoop的数据仓库Hive.
Android開發環境建置與設定 Android智慧型手機程式設計 程式設計與應用班 建國科技大學 資管系 饒瑞佶 2012/4 V1
資料庫管理 Homework 期末專題 使用MySQL / Windows and Mac 楊立偉教授 台灣大學工管系 2017.
資料探勘-案例期末報告 SQL Server 2008 Analysis Service
巨量資料分析與應用 (1) 楊立偉教授 台大工管系暨商研所 2014 Fall.
研究方法 Research Methodology
Data Mining 工具介紹 (Weka / R)
第5章 方案工程(Solutions Engineering)
Data Mining 工具介紹 (Weka/R + ODBC)
Data Mining 資料探勘 Introduction to Data Mining Min-Yuh Day 戴敏育
常用資料採礦技術介紹 關聯分組(associations)、分類(classification)、時序相關(sequence)、預測(forecasting)、群集化(clustering)以及描述等分析作業,目前常用的資料採礦技術有決策樹、類神經網路、基因演算法以及即時線上分析(OLAP)
生 物 信 息 学 Bioinformatics 巩晶 癌症研究中心 山东大学 医学院
Oracle Containers for J2EE(OC4J) 独立版
Java基础入门 第1章 Java开发入门 · Java语言的特点 · Java开发环境的搭建 · 环境变量的配置 · Java的运行机制.
Android盤點系統 組別:第九組 組員:四資工三B 4980E046 宋佩鴻 四資工三B 4980E054 詹典易
Data Mining 第八組 B 萬佳育 B 葉書蘋.
市場調查與分析 Marketing Research and Analysis
VISP+MS 国际高校访问学生 及统计理学硕士项目
專題J組 題目: 檢定考試管理系統 指導老師: 曾修宜 老師 組員: 曾聖棋 謝宗翰
程式設計 老師:戴自強 助教:楊斯竣.
Data Mining 工具介紹 (Weka/R to MySQL)
物联网数据处理 第一讲 数据处理基本概念 刘进军 QQ:
Python联合服务器的使用.
常見的巨量資料分析與應用 楊立偉教授 台大工管系暨商研所 2018.
第一章 数 据 库 概 述 第一节 引言 第二节 数据库基本概念 第三节 数据库系统结构 第四节 数据模型 第五节 数据库管理系统
Course 4 分類與預測 Classification and Prediction
古佳怡 實驗流程.
課程網站
程式設計 老師:蘇炳煌 助教:楊斯竣.
Java Lab1 introduction.
主讲人:黄鹤 副教授 Office:9-416 劳动关系与劳动政策 主讲人:黄鹤 副教授 Office:9-416.
SPSS软件基本介绍 一、什么是SPSS? 二、SPSS软件的发展历史 三、SPSS软件的特点 四、SPSS软件的基本功能.
常見的巨量資料分析與應用 楊立偉教授 台大工管系暨商研所 2017.
遊戲設計 Homework3 – 小朋友下樓梯.
An Quick Introduction to R and its Application for Bioinformatics
文字和網站探勘 學習目標 說明文字探勘與了解文字探勘需求 分辨文字探勘與資料探勘 了解文字探勘的不同應用 了解執行文字探勘專案的流程
数数据的基本操作 电子工业出版社.
树立开放理念 强化管理水平 全面提升来华留学生教育工作水平
商業智慧實務 Practices of Business Intelligence
Term Project : Requirement
Usage Eclipse 敏捷方法工具介紹 實驗室網站:
第10章 網路問卷調查.
Presentation transcript:

Data Mining 工具介紹 (Weka+JDBC) Supplement 2 Data Mining 工具介紹 (Weka+JDBC) 楊立偉教授 台灣大學工管系 2017 1

Data Mining 工具 The R Project for Statistical Computing http://www.r-project.org/ Weka : Data Mining Software in Java http://www.cs.waikato.ac.nz/ml/weka/ scikit-learn: machine learning in Python http://scikit-learn.org/stable/ SAS Enterprise Miner (EM) Business Analytics and Business Intelligence Software IBM SPSS Predictive analytics software and solutions and others

使用WEKA及JDBC連接至MySQL 3

Installing Java 至Oracle下載JDK (Java Development Kit) 並安裝 http://www.oracle.com/technetwork/java/javase/downloads/index.html

Installing WEKA 下載跨平台版本 (weka-3-9-2.zip) 並解壓縮至特定目錄,例如/weka https://www.cs.waikato.ac.nz/ml/weka/downloading.html V

Installing MySQL JDBC Driver 下載MySQL JDBC Driver (mysql-connector-java-5.1.45.zip) 並解壓縮至同一目錄,例如/weka https://dev.mysql.com/downloads/connector/j/5.1.html V

Testing WEKA (1) 下載老師的設定檔DatabaseUtils.props至/weka 目錄結構如下圖

Testing WEKA (2) 以Windows為例,搜尋cmd後執行,開啟命令提示字元 (Mac請開啟工具程式下的終端機) 執行java,若有出現版本訊息,代表java環境已備妥 執行 cd /weka/weka-3-9-2/weka-3-9-2 執行 java -cp weka.jar;../../mysql-connector-java-5.1.45/mysql-connector-java-5.1.45/mysql-connector-java-5.1.45-bin.jar -Xmx500m weka.gui.GUIChooser

Testing WEKA (3) 選KnowledgeFlow,在DataSources選DatabaseLoader,在右邊工作畫布上放置一個,選取後按右鍵選Configure…

Testing WEKA (4) Database URL輸入 輸入帳號密碼,輸入載資料的SQL指令, 選擇DB config file jdbc:mysql://sqldb.demo.tornado.com.tw:3306/sample 輸入帳號密碼,輸入載資料的SQL指令, 例如 SELECT outlook, temperature, humidity, windy, play FROM tennis 選擇DB config file C:\weka\DatabaseUtils.props

Testing WEKA (5) 在Visualization選TextViewer,在右邊工作畫布上放置一個,選取DatabaseLoader後按右鍵選dataSet,產生一條線連至TextViewer

Testing WEKA (6) 在左上角按下執行按鈕,下方訊息若出現Finished表示完成 (若有錯誤訊息請檢查設定) 選取TextViewer後按右鍵選Show results,若出現查詢結果表示成功

使用WEKA進行Data Mining 13

Using Weka (1) - Tree 放置Evaluation→ClassAssigner,以及TrainingSetMaker 放置Classifiers→trees→J48 (即C4.5演算法之實作) 放置Visualization→TextViewer

Using Weka (2) - Tree 在DatabaseLoader按右鍵選dataSet到ClassAssigner 在ClassAssigner按右鍵選dataSet到TrainingSetMaker 在TrainingSetMaker按右鍵選trainingSet到J48 在J48按右鍵選text到TextViewer

Using Weka (3) - Tree 在ClassAssigner按右鍵選configure確認目標欄位是play 在左上角按下執行 在TextViewer按右鍵選Show results看結果

Using Weka (4) Clustering 使用Simple Kmeans演算法,用TextViewer看結果 以k=3為例

Using Weka (5) Association 使用Apriori演算法,用TextViewer看結果 只能處理nominal value

Using Weka (6) Association 使用Apriori演算法結果如下 * 決策樹的每條path可能就是一條rule;可能會找到更多的rules