資料庫管理 Homework 期末專題 楊立偉教授 台灣大學工管系 2016.

Slides:



Advertisements
Similar presentations
第二章 简单的 SQL 语句. 本章要点  创建一个简单的表  SQL 语句介绍  最简单的查询语句 select  带有限制条件的查询  查询结果的排序显示.
Advertisements

Data type P64 ‘’ 转义字符 P67 P68 EXE,选出某个教师的学生中最新的一 个,要姓名, ID (,LIMIT ) EXISTS,NOT EXISTS P409 Q,EXISTS 和 in 的区别( 1000 ,查询结果)
应用地球物理卓越人才培养体系构建与实践 吉林大学地球探测科学与技术学院 刘 财 经验交流.
Select 指令 基本結構 WHERE Like語法 Order by與group by Having 與 AS
第6章 数据库管理软件Access 年秋.
顧客交易紀錄分析實務 概述 26.2 資料分析的過程 26.3 顧客交易紀錄分析說明 26.4 實作一、顧客活動剖析實務演練
淘宝海量数据产品技术架构 张轩丞(朋春) 淘宝网-数据平台与产品部.
SQL的简单查询.
第5章 关系数据库标准语言SQL 主讲:张丽芳.
十一 ASP对数据库的访问.
10-1 資料庫管理系統簡介 10-2 關聯式資料模式和查詢語言 10-3 Access 簡介 10-4 XML 簡介
第2讲 Transact-SQL语言.
数据库技术 实践.
理工科系介紹 - 呂宛儒老師.
第8章 SELECT敘述的基本查詢 8-1 SELECT查詢指令 8-2 SELECT子句 8-3 FROM子句 8-4 WHERE子句
先進觀念 • 輕鬆掌握 商周數位學院 《當圓形遇上三角形》 建議最佳閱讀版本:powerpoint 2000.
第4章 关系数据库标准语言SQL 4.1 SQL语言概述 4.2 SQL数据查询功能 4.3 SQL数据操作功能 4.4 SQL数据定义功能.
第二章 資料的蒐集與整理 授課教師: 更新.
数据库概述 简而言之,数据库(DataBase)就是一个存储数据的仓库。为了方便数据的存储和管理,它将数据按照特定的规律存储在磁盘上。通过数据库管理系统,可以有效的组织和管理存储在数据库中的数据。如今,已经存在了Oracle、SQL Server、MySQL等诸多优秀的数据库。在这一章中将讲解的内容包括。
东南大学 数字迎新的探索 东南大学 网络与信息中心 张月琳.
文科计算机小公共课规划教材 Access 程序设计.
计算机导论 苏州职业大学计算机工程系 徐卫英 QQ:
乙檢直通車 推廣小組:台科大圖書 報告人:孫婉倩.
全球暖化 想知道全球暖化的嚴重性嗎? 那就繼續看下去吧!! 組員:陳儀君60524 蘇鈺祺60526 于玉琳60528 林宥嫻60521.
第5章 演示文稿制作软件 5.1 中文Powerpoint2003基础 5.2 创建演示文稿 5.3 制作幻灯片 5.4 演示文稿的修饰
玉溪工业财贸学校副校长 示范校建设办公室主任 柏家渭 2014年5月13日
第3章 数据查询与SQL命令.
学习方法建议 首先应该有明确的学习动机,解决思想问题。 然后根据自己实际要有一个明确的学习目标。
Views ,Stored Procedures, User-defined Function, Triggers
資料庫管理 HOMEWORK #3 楊立偉教授 台灣大學工管系 2013 Fall.
第六章 學習SQL語言.
Supplement Data Mining 工具介紹 楊立偉教授 台灣大學工管系 2014 Fall 1.
Supplement Data Mining 工具介紹 楊立偉教授 台灣大學工管系 2015 Fall 1.
JAVA vs. SQL Server 建國科技大學 資管系 饒瑞佶 2013/4 V1.
Chapter 12 T-SQL 語法與 ASP.NET.
第八章 利用SELECT查詢資料.
班級:博、碩子一甲 授課老師:鐘國家 助教:陳國政
实验 2:MS Access QBE Query使用
資料庫管理 HOMEWORK #3 楊立偉教授 台灣大學工管系 2015 Fall.
Data Mining 工具介紹 (Weka / R)
MySQL 結構化查詢語言 MySQL.
資料庫管理 HOMEWORK #4 楊立偉教授 台灣大學工管系 2014 Fall.
付款作業錯誤態樣【出納組】 錯誤1~核銷文件備具不齊 錯誤2 ~戶名與系統不同 錯誤3 ~未輸發票號碼日期 錯誤4 ~受款人帳號輸錯
資料庫管理 Homework #4 楊立偉教授 台灣大學工管系 2016.
短除法 雪狼頭目.
如何取得財務報表 台灣經濟新報資料庫 情報贏家 公開資訊觀察站:
資料庫管理 Homework 期末專題 楊立偉教授 台灣大學工管系 2018.
Homework : Similarity, Classification, Training and Prediction
作者: 丁建均 國立台灣大學電信工程學研究所
Term Project : Requirement
第18章 SQL結構化查詢語言 18-1 SQL語言的基礎 18-2 SQL的查詢指令 18-3 SQL子查詢與合併查詢.
資料庫系統 李翊豪 2017/12/21 Reference
3. SQL语言的应用 3.1 SQL历史和优点 3.2 数据查询 3.3 数据操纵.
学习目标 1、什么是表连接 2、表连接类型 3、表连接区别.
数据透视表与SQL典型应用 ——数据分析人士必杀技
查询与视图 蔡海洋.
第14章 SQL数据查询与操纵 内容提要 本章知识点
SQL查询语句 蔡海洋.
附錄D Access應用說明 主從式資料庫系統 - 附錄D.
Microsoft Word 2003 透視合併列印 Microsoft MVP 王作桓.
SQL語法教學 2015/10/15 John.
11 檢視表的建立 11-1 檢視表的基礎 11-2 建立檢視表 11-3 修改與刪除檢視表 11-4 編輯檢視表的內容.
数据分析工具 第10节.
資料庫管理 HOMEWORK #2 楊立偉教授 台灣大學工管系 2013 Fall.
楊立偉教授 台灣科大資管系 © Copyright 2016 by Willie Yang
模块六 数据库管理软件——Access 2010.
楊立偉教授 台灣科大資管系 © Copyright 2015 by Willie Yang
Term Project : Requirement
第4章 数据查询.
第 9 章 查詢資料- 善用 SELECT 敘述.
Presentation transcript:

資料庫管理 Homework 期末專題 楊立偉教授 台灣大學工管系 2016

Requirement 應用真實世界的大數據進行探索性分析,找出有商業價值之應用

題目分派 主題資料集 每組任選其一(可與它組交換),分派如下 繳交紙本報告 期末每組上台簡報 組別 資料集1 資料集2 1 (財經)新聞 Movie 7 13 2 Food 8 14 3 Stock 9 15 4 通訊板 10 16 5 合購版 11 17 6 投資理財 12 18

主題資料集 2016資料集 下載連結 以7zip解壓縮(含密碼), Access格式 2016/1/1~2016/11/30 PTT Movie, Food, MobileComm, BuyTogether, Stock 鉅亨網, Yahoo奇摩理財, Yahoo股市, 聯合財經網 (全) mobile01 > 投資與理財 以7zip解壓縮(含密碼), Access格式 可以用ODBC剪貼入MySQL 或是用工具轉換, 搜尋「access to mysql」

主題資料集 2015資料集 下載連結 資料集 Gossiping 9月 10月 11月 12月 Food 9-12月 MobileComm Movie BuyTogether 1999 7-10月

作業要求 指派領域 針對該領域所收到的資料,進行分析 設計十個以上具商業價值的問題,並以SQL回答 將問題設計(含SQL及答案)作成報告 有層次地講出一個觀察、一個故事、或一種預測

評分標準 分成10個等級 指派領域 依詳盡用心程度加分 商業問題設計,正確合理 發掘不為人知的資訊 使用MS Excel (Power) Pivot 製作有意義之圖或表,並詮釋之 使用Weka或R或類似工具進行分析,印出結果,並詮釋之 使用一種以上資料彼此解釋某種現象,並詮釋之 例如股市新聞加TEJ股價資料,或Movie加網路公開之票房資料等

Deadline 於 2017.1.5 前繳至 ceiba,並於當天簡報 由組長繳交即可 以 Word檔,做文字說明報告 取名為「組別_hw5.doc」 以 PowerPoint,做簡報(10分鐘內) 取名為「組別_hw5.ppt」 兩者一同壓縮為「組別_hw5.zip」

資料庫管理 Homework 社群資料分析範例 楊立偉教授 台灣大學工管系 2016

社群資料分析 結合結構性與非結構性資料 結構性資料 非結構性資料 (文字) 以一或多句SQL查詢分析 以標記技巧轉為結構化資料 輔以字串處理函數 再以一或多句SQL查詢分析

社群資料分析 – 以Food為例 (1) 列出推噓最熱門的主文 列出正面情緒最高的主文 SELECT title, comment_count, post_time, author FROM ts_page_content WHERE content_type='main' ORDER BY comment_count DESC; SELECT title, comment_count, positive_score, post_time, author FROM ts_page_content WHERE content_type='main' ORDER BY positive_score DESC;

社群資料分析 – 以Food為例 (2) 配合字串處理,統計文章標題類別 left(string, len) 自左邊取len個字 right(string, len) 自右邊取len個字 mid(string, start, len) 自start起取len個字 可搜尋Access說明"字串" → 字串函數及其使用方法 SELECT mid(title,2,2), count(*) FROM ts_page_content WHERE content_type='main' and left(title,1)='[' GROUP BY mid(title,2,2) ORDER BY count(*) DESC;

社群資料分析 – 以Food為例 (3) 依餐廳名稱之討論熱門度進行統計 Step 1 以字串處理取出餐廳名稱,暫存為tmp SELECT id, title, author, instr(1,content,"餐廳名稱:") AS pos1, instr(pos1,content," ") AS pos2, mid(content,pos1+5,pos2-pos1-5) AS shopname INTO tmp FROM ts_page_content WHERE content_type='main';

社群資料分析 – 以Food為例 (3) Step 2 與原表JOIN統計最熱門的餐廳 若要加速,可將 JOIN 及WHERE條件欄位轉為短文字varchar並建立索引 人工過濾雜訊資料 SELECT t.shopname, count(*) FROM ts_page_content AS c, tmp AS t WHERE c.content_type='main' AND c.id=t.id AND t.shopname<>'' GROUP BY t.shopname ORDER BY count(*) DESC;

社群資料分析 – 以Food為例 (4) 依內容關鍵字詞或特殊人事物做標記 分次逐步進行標記,例如分為「貴」與「便宜」 之後可單用該表,或與原表JOIN做查詢分析 首次 SELECT id, title, author, "貴" AS tag INTO tmp2 FROM ts_page_content WHERE content_type='main' AND (content like '*好貴*' OR content like '*有點貴*') 之後 INSERT INTO tmp2 SELECT id AS id, title AS title, author AS author, "便宜" AS tag AND (content like '*便宜*' AND NOT content like '*不便宜*')

社群資料分析 – 以Food為例 (5) 列出貴的餐聽 列出便宜的餐廳 SELECT t.shopname, count(*) FROM tmp AS t, tmp2 as g WHERE t.id=g.id AND tag='貴' and t.shopname<>'' GROUP BY t.shopname ORDER BY count(*) DESC; SELECT t.shopname, count(*) FROM tmp AS t, tmp2 as g WHERE t.id=g.id AND tag='便宜' and t.shopname<>'' GROUP BY t.shopname ORDER BY count(*) DESC;

GOOD LUCK !