Supplement Data Mining 工具介紹 楊立偉教授 台灣大學工管系 2015 Fall 1.

Slides:



Advertisements
Similar presentations
1. 一. 人口分布  全球約十分之九的人口集中在北半球。  三大人口稠密區:亞洲東南半壁、歐洲、北美洲東部  季風亞洲人口占全球一半。  人口稀少區 太乾-北非撒哈拉沙漠 太濕-亞馬孫、剛果雨林 太冷-西伯利亞、南極 崎嶇-東非、青藏高原 2 台灣人口分佈狀況 (04 : 43) p.83.
Advertisements

庄文忠 副教授 世新大学行政管理学系 2012/7/6 SPSS 之应用 ( 庄文忠副教授 ) 1 SPSS 的环境与基本操作.
Big Data Ecosystem – Hadoop Distribution
上海体育职业学院 祁社生 一、重视体育科研在提高竞技运动训练水平中的意义和作用
第五章 資訊科技基礎建設與新興科技.
C语言程序设计 李伟光.
教學經驗分享 吳毅成 國立交通大學資訊工程系 2012年4月.
SQL的简单查询.
数据分析及研究方法 ——以如何从事宏观经济课题研究为例
TALK ABOUT 数据挖掘-十大经典法 QianShi Li-Design
云计算业务应用-数据挖掘.
Oracle SQL Developer 中有哪些新增功能
中国文学 王馨.
转正述职报告 乐恩公司 史航
第十五章 常見的資料庫管理系統 目的 Oracle 微軟SQL Server 微軟Access MySQL Oracle 應用伺服器
传媒学院2013年度团委工作 总结分析报告
臺北市立大學 資訊科學系(含碩士班) 賴阿福
程式設計概論 1.1 程式設計概論 程式語言的演進 物件導向程式 程式開發流程 1.2 C++開發工具
Supplement Data Mining 工具介紹 楊立偉教授 台灣大學工管系 2014 Fall 1.
JAVA vs. SQL Server 建國科技大學 資管系 饒瑞佶 2013/4 V1.
作業系統 補充: 雲端運算.
JDK 安裝教學 (for Win7) Soochow University
Data Mining 工具介紹 (Weka+JDBC)
資料庫管理 操作DBMS 指導教授:楊維邦  助教:廖皓翔.
資料探勘-案例期末報告 SQL Server 2008 Analysis Service
Working with Databases (II) 靜宜大學資管系 楊子青
巨量資料分析與應用 (1) 楊立偉教授 台大工管系暨商研所 2014 Fall.
实验 2:MS Access QBE Query使用
Data Mining 工具介紹 (Weka / R)
Data Mining 工具介紹 (Weka/R + ODBC)
Data Mining 資料探勘 Introduction to Data Mining Min-Yuh Day 戴敏育
常用資料採礦技術介紹 關聯分組(associations)、分類(classification)、時序相關(sequence)、預測(forecasting)、群集化(clustering)以及描述等分析作業,目前常用的資料採礦技術有決策樹、類神經網路、基因演算法以及即時線上分析(OLAP)
生 物 信 息 学 Bioinformatics 巩晶 癌症研究中心 山东大学 医学院
安裝JDK 安裝Eclipse Eclipse 中文化
自由軟體介紹(一) 把flash通通帶回家 報告人:陳俊銘.
Windoop操作步驟 於作業系統Windows 10 專業版.
Android App簡介及 App Inventor 2體驗 靜宜大學資管系 楊子青
電腦攻擊與防禦 使用電腦教室VMware軟體說明.
圖形溝通大師 Microsoft Visio 2003
Data Mining 工具介紹 (Weka/R to MySQL)
Java程式設計 Eclipse.
物联网数据处理 第一讲 数据处理基本概念 刘进军 QQ:
App Inventor 2初體驗 靜宜大學資管系 楊子青
AOT_供應商安裝手冊.
107學年度國民中學 學障鑑定個測工作說明 Loading…… 臺東縣特教資源中心.
常見的巨量資料分析與應用 楊立偉教授 台大工管系暨商研所 2018.
資料來源 2 網路過濾軟體之安裝說明 資料來源 2.
数据透视表与SQL典型应用 ——数据分析人士必杀技
Install OpenCV C++ with Visual Studio 2017 on Windows PC
FTP使用教學 簡介: 軟體名稱:FileZilla 軟體性質:Freeware 版本: 繁體中文版
主讲人:黄鹤 副教授 Office:9-416 劳动关系与劳动政策 主讲人:黄鹤 副教授 Office:9-416.
常見的巨量資料分析與應用 楊立偉教授 台大工管系暨商研所 2017.
Text To Speech (TTS, 文字轉 語音)、讀簡訊 靜宜大學資管系 楊子青
第九組報告 指導教授 : 林振緯 組員 : 資工四甲 曹又升 黃晏林 黃冠惟
電子郵件安全:如何防範社交工程郵件 圖書資訊服務處 元智大學.
Microsoft Word 2003 透視合併列印 Microsoft MVP 王作桓.
文字和網站探勘 學習目標 說明文字探勘與了解文字探勘需求 分辨文字探勘與資料探勘 了解文字探勘的不同應用 了解執行文字探勘專案的流程
树立开放理念 强化管理水平 全面提升来华留学生教育工作水平
方格紙上畫正方形.
連結資料庫 MYSQL.
商業智慧實務 Practices of Business Intelligence
楊立偉教授 台灣科大資管系 © Copyright 2016 by Willie Yang
楊立偉教授 台灣科大資管系 © Copyright 2015 by Willie Yang
資料庫應用與實作 一到六章重點、習題.
大数据应用人才培养系列教材 R 语言 刘 鹏 张 燕 总主编 程显毅 主编 刘颖 朱倩 副主编.
大数据应用人才培养系列教材 数据挖掘基础 刘 鹏 张 燕 总主编 陶建辉 主编 姜才康 副主编.
Term Project : Requirement
第10章 網路問卷調查.
数据库应用技术 天津电大 翟迎建.
Quantum-Wise軟體教學.
Presentation transcript:

Supplement Data Mining 工具介紹 楊立偉教授 台灣大學工管系 2015 Fall 1

Data Mining 工具 The R Project for Statistical Computing http://www.r-project.org/ Weka : Data Mining Software in Java http://www.cs.waikato.ac.nz/ml/weka/ SAS Enterprise Miner (EM) Business Analytics and Business Intelligence Software IBM SPSS Predictive analytics software and solutions and others

Using Weka (1) 下載Weka (含Java 7) 安裝後執行 亦可獨立下載安裝Java 7 (支援ODBC) 後再下載Weka ZIP, 解壓縮後點weka.jar執行 http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260.html http://prdownloads.sourceforge.net/weka/weka-3-6-11.zip

Using Weka (2) 可參考手冊 WekaManual.pdf 下載Access資料庫tennis.accdb,在ODBC新增來源名稱為tennis,供待會連接使用 啟動Weka後,點選KnowledgeFlow

Using Weka (3) 選擇DataSources→DatabaseLoader 置放在工作區,選取後按右鍵選Configure…

輸入 jdbc:odbc:tennis SELECT outlook, temperature, humidity, windy, play FROM playtennis

Using Weka (4) 放置Evaluation→ClassAssigner,以及TrainingSetMaker 放置Classifiers→trees→J48 (即C4.5演算法之實作) 放置Visualization→TextViewer

Using Weka (5) 在DatabaseLoader按右鍵選dataSet到ClassAssigner 在ClassAssigner按右鍵選dataSet到TrainingSetMaker 在TrainingSetMaker按右鍵選trainingSet到J48 在J48按右鍵選text到TextViewer

Using Weka (6) 在ClassAssigner按右鍵選configure確認目標欄位是play 在DatabaseLoader按右鍵選Start loading 執行完畢,在TextViewer按右鍵選Show results看結果

Using Weka (7) Clustering 使用Simple Kmeans演算法,用TextViewer看結果 以k=3為例

Using Weka (8) Association 使用Apriori演算法,用TextViewer看結果 只能處理nominal value

Using Weka (9) Association 使用Apriori演算法結果如下 * 決策樹的每條path可能就是一條rule;可能會找到更多的rules

Using R with Database (1) 挑選CRAN(Comprehensive R Archive Network)中之站點,下載R安裝後執行 http://cran.csie.ntu.edu.tw/ 台大資工站點 選擇base版本下載,點擊安裝 之後執行R

Using R with Database (2) 安裝RODBC套件 選程式套件>安裝程式套件>挑選CRAN站點: 0-Cloud 選RODBC後即可 執行指令 library(RODBC) 載入該套件 c <- odbcConnect(“tennis”) 開啟連線, 取名為c sqlTables(c) 列出該ODBC來源的所有表格

Using R with Database (3) 執行指令 sqlFetch(c, “playtennis”) 從該來源取出某張表 sqlQuery(c, “SELECT outlook, temperature, humidity, windy, play FROM playtennis”) 從該來源執行某句SQL

執行結果