《大数据导论(通识课版)》 第6章 大数据思维 (PPT版本号:2019年秋季学期)

Slides:



Advertisements
Similar presentations
第六章 人事行政 一、教案释疑 政府系统内非经选举或政治任命产生 的常任文官 —— 这样的公务员是何种公务员 ?
Advertisements

〈媽媽的手〉 國二甲 蔡于均. 一.題旨 作者寫本文時,已身為人母,深深體會 到一個母親持家的辛勞,自然想起 了母親,以「媽媽的手」為題,歌 頌中國傳統婦女堅忍耐勞的美德, 並表達對母親的懷念。
组长:陈俊帆  组员:秦宗浩 何美林 白珊珊 蒋壮壮 黄 兰森 任雨之  班级:高 2014 级 2 班  指导老师:刘芬.
撒哈拉以南的非 洲. 学习目标(一) 1. 了解撒哈拉以南的非 洲的自然环境特点。 2. 记住撒哈拉以南的非 洲独特的人文特点。
目录 古诗 现代诗 春夏秋冬 返回 咏柳 (贺知章) 碧玉妆成一树高, 万条垂下绿丝绦。 不知细叶谁裁出, 二月春风似剪刀。
教學單元:嬉遊記 活動主題:西遊記 - 三借芭蕉扇 低年級語文領域成員: 蔡妮君、劉盈秀、林嘉璇、郭惠玟、施乃菁、廖丸毅、李思韻.
建设党员标兵制 ——“ 选树 ” 学生党员标兵的探索与经验 传媒学院学生党支部 曲阜师范大学 2015 年度党支部创新活动方案验收汇报 2016 年 5 月 20 日.
组长:肖志远 组员:王嘉乐 翁家程 冯乐微 陶天皓 赵泽昊 “读书有味”主题阅读 阅读书目: 《西游记》 研究主题: 孙悟空的性格特点.
关于 “ 上海的新移民与传播 ” 研究调查报告.  小组成员:(周五上午班级)  董正椽: 研究设计及书面报 告  邵必为: ppt 制作、调查  曹本沛: 调查  江智东 调查  夏昊:
Xiamen University 厦门大学妇女 / 性别教学与培训机制 化探索 厦门大学妇女 / 性别研究与培训基地 2007 年 7 月 26 日.
团队指导老师:李春虎 团队核心:黄跃民 团队成员:廖育人 朱蒙 郁倩.  姓名:黄跃民  专业:印度尼西亚语  学历:研究生  学位:博士  主要承担课程:高级印 尼语,印尼语泛读,印 尼文化  姓名:郁倩  专业:印度尼西亚语  学历:本科  学位:学士  主要承担课程:基础印.
耐心陪孩子玩,即使你真的认为他的游戏内容很无聊。. 请蹲下来和孩子说话。 一开始别太在乎孩子成绩,要关心他是否喜欢学校。
创造现代生活 纸的利用与装饰. 中国古代四大发明对世界文明的发 展有什么影响? 我们的调查:  四大发明在人类文明史上的重要地位 :  四大发明在欧洲近代文明产生之前陆续传入西方,成为 “ 资 产阶级发展的必要前提 ”( 《马克思恩格斯全集》 ) ,为资产阶 级走上政治舞台提供了物质基础:印刷术的出现改变了只有.
智慧城市创意设计 大赛说明 中国智慧城市产业技术创新战略联盟 2014 年 3 月. 背景介绍 1. 创意启迪智慧 创新驱动发展.
19 世纪不同国家的文学 作品所反映的社会现实. 法国:《我的叔叔于勒》 —— 莫泊桑 俄罗斯:《胖子与瘦子》 —— 契科夫 美国:《麦琪的礼物》 —— 欧亨利 选取的作品.
第三單元 我的世界宇宙大 教學設計:黃筱晶. 一、使用說明 (一) 本教學設計核心概念為「生涯發展」,共 四節課, 160 分鐘。 (二) 為了讓小學教學現場更加適用,教師可選 擇連續實施四節課,或彈性選擇其中一節 課或二節或三節課實施。 (三)四節課都進行是最完整的,但若因時間不允 許只進行其中一節課或二節或三節課實施,
2011 年中考复习教学研讨会议程 一、初三质检试卷分析(学科中学组成员) 1. 启明中学 2. 连江三中片 3. 凤城中学片 4. 全县质检数据通报 二、考试说明解读及复习建议.
上海市职业能力考试院 职称外语考试网上报名指导 (仅供参考). 考试报名 注意事项: 1 、本 PPT 旨在帮助考生熟悉上海市职业 能力考试院网上考试报名,仅供参考。 2 、每次考试报名细节处可能会有不同, 请具体关注考试院网上具体信息。
第二組 資料蒐集: 楊淳雅 陳佑安 PPT 製作: 陳薇如 口頭報告: 凃偌雯 葉于禎.
一、教学目标: 1 、阅读文章感悟作者的评论观点。 2 、阅读《百合花》,简述故事的情节。 3 、掌握小说阅读的基本方法。 4 、结合作者的观点和自己的体会,选取 一个角度赏析作品,谈出自己的独特见 解和感受。 二、教学重点、难点: 同目标 3 、 4.
课程介绍 (PPT版本号:2016年1月24日版本) 温馨提示:编辑幻灯片母版,可以修改每页PPT的厦大校徽和底部文字 林子雨
荒岛求生 ——浅谈鲁滨逊的生存智慧.
高级软件工程 复习课.
对应用型本科建设中若干问题的认识 张家钰
第120讲:Hadoop的MapReduce和Yarn的配置实战详解
课程指向:学生的核心素养(学会学习、关系构建) 2016年5月 学校课程顶层设计与实施
虛竹之品 德修五寮 台北縣五寮國小 林義祥校長.
第八讲 基于Hadoop的数据仓库Hive (PPT版本号:2016年4月6日版本)
大数据时代 生活、工作与思维的大变革.
公文製作與習作 行政院秘書處 93年10月11日.
 台南縣私立興國高級中學  公文橫式書寫推動說明會簡報 93年12月22日 總務處 編製.
小人物,大精神 谭君如小组
10月童话 农夫与蛇后传 所有马超都念马梁云超 马超小组.
第八章 期权定价的数值方法 Copyright©Zhenlong Zheng 2003, Department of Finance, Xiamen University.
水浒传中的英雄 蔡文硕组.
J107 胡婷涵 28號.
网络环境下的     古诗词教学  广州市越秀区东山培正小学  古凤岚.
《大数据技术原理与应用》 课程介绍 (2016春季学期)
《三国演义》 “恢复汉室”治国团队の设计.
《计算机应用基础》 第六章 Access数据库管理系统
为教师开展大数据课程教学提供全方位、一站式服务
孙桥农业园区 迅游队.
崑山科大99下學年 國文報告 一個癌症媽咪給兒子的遺書
發展東華特色課程 期末成果發表 呂進瑞 國立東華大學財金系.
《民法精品课程》整体介绍 安徽警官职业学院《民法精品课程》课 题 组.
基 础 会 计 ——资产及简单资产业务的 会计处理 授课教师:唐君
幼儿园新教师岗前培训方案 滨城区第一小学幼儿园.
摘要說明 使用的時機:閱讀教育 步驟:介紹書籍資料後進行討論 適用的領域或議題:語文領域 單元名稱:自創教材.
民族风情 主题阅读.
星星的眼淚 星星的眼淚 班級:S202 座號:46 姓名:鄭媛文 作品:星星的眼淚
第5章 NoSQL数据库 (PPT版本号:2017年2月版本)
第3章 分布式文件系统HDFS (PPT版本号:2017年2月版本)
第2章 大数据处理架构Hadoop (PPT版本号:2017年2月版本)
《大数据技术原理与应用》 第七章 MapReduce (2016春季学期) 林子雨 厦门大学计算机科学系 主页:
第九讲 Hadoop架构再探讨 (2016春季学期)
《大数据技术原理与应用》 第十二讲 图计算 (2016春季学期)
基于大数据的物流资源整合 福建师范大学协和学院 沈庆琼.
《Spark编程基础》 《 Spark编程基础》课程介绍 (PPT版本号:2018年2月)
國立中興大學107年度 公文寫作進階核稿研習 公文程式與製作 講授人:林起潛 民國107年8月6日.
創意與創新管理 上課記實 成功的簡報製作技巧 王儷娟老師.
參考資料來源:國家圖書館遠距學園 簡報製作:林秀玲.
教育部增置國小圖書教師輔導與教育訓練計畫 圖書資訊教育教學綱要及教學設計小組 設計者:臺北市萬興國小 曾品方老師
參考資料來源:國家圖書館遠距學園 簡報製作:林秀玲.
公文書信製作 國立二林工商 人事室主任王慶城.
華語文學與思想報告 指導:賴慧玲老師 國際商務學系一年級B班 第二組
清明上河圖 於原作 原作者 擇端(北宋) 北宋風俗畫作品 中國十大傳世名畫之一,屬一级國寶 欲知詳情請點出口   清乾隆 摹本 清明上河.
資料來源:九德國小 新庄國小中年級圖書利用教育 書的身體 資料來源:九德國小 授課者 王美惠老師.
第8章 Spark MLlib (PPT版本号: 2019年春季学期)
《大数据导论(通识课版)》 第4章 大数据应用 (PPT版本号:2019年秋季学期)
《大数据导论(通识课版)》 教材官网: 第5章 大数据安全 (PPT版本号:2019年秋季学期)
Presentation transcript:

《大数据导论(通识课版)》 第6章 大数据思维 (PPT版本号:2019年秋季学期) 教材官网: http://dblab.xmu.edu.cn/post/bigdataintroduction/ 第6章 大数据思维 (PPT版本号:2019年秋季学期) 温馨提示:编辑幻灯片母版,可以修改每页PPT的厦大校徽和底部文字 林子雨 厦门大学计算机科学系 E-mail: ziyulin@xmu.edu.cn 主页:http://www.cs.xmu.edu.cn/linziyu 扫一扫访问教材官网 厦门大学计算机科学系 2019版

课程教材 林子雨 编著《大数据导论——数据思维、数据能力和数据伦理(通识课版)》 高等教育出版社,2019年11月

提纲 6.1 传统的思维方式 6.2大数据时代需要新的思维方式 6.3大数据思维方式 6.4运用大数据思维的具体实例 百度搜索厦门大学数据库实验室网站访问平台

6.1 传统的思维方式 机械思维 第一,世界变化的规律是确定的,这一点从托勒密到牛顿大家都认可。 第二,因为有确定性做保障,因此规律不仅是可以被认识的,而且可以用简单的公式或者语言描述清楚。这一点在牛顿之前,大部分人并不认可,而是简单地把规律归结为神的作用。 第三,这些规律应该是放之四海而皆准的,可以应用到各种未知领域指导实践,这种认识是在牛顿之后才有的。

6.2大数据时代需要新的思维方式 不确定性在我们生活的世界里无处不在,由于不确定性是这个世界的重要特征,以至于我们按照传统的方法——机械论的方法,很难做出准确的预测 世界的不确定性,折射出在信息时代的方法论:获得更多的信息,有助于消除不确定性,因此,谁掌握了信息,谁就能够获取财富,这就如同在工业时代,谁掌握了资本谁就能获取财富一样。 数据学家认为,世界的本质是数据。通过采集、量化、计算、分析各种事物,来重新解释和定义这个世界,并通过数据来消除不确定性,对未来加以预测 转变思维方式,努力把身边的事物量化,以数据的形式加以对待,这是实现大数据时代思维方式转变的“核心”

6.3大数据思维方式 6.3.1全样而非抽样 6.3.2效率而非精确 6.3.3相关而非因果 6.3.4 以数据为中心 6.3.5 我为人人,人人为我

6.3.1全样而非抽样 数据太多,无法保存和分析,统计学采用抽样

6.3.2效率而非精确 不是追求精确 追求效率

6.3.2效率而非精确 误差 误差 抽样计算的结果误差,放到全样上,会被放大

6.3.3相关而非因果 相关性 网店自动推荐相关的另一本书 用户在网店购买一本书

6.3.4 以数据为中心 数据驱动方法从 20 世纪 70 年代开始起步,在八九十年代得到缓慢但稳步的发展。进入 21 世纪后,由于互联网的出现,使得可用的数据量剧增,数据驱动方法的优势越来越明显,最终完成了从量变到质变的飞跃。如今很多需要类似人类智能才能做的事情,计算机已经可以胜任了,这得益于数据量的增加。 全世界各个领域数据不断向外扩展,渐渐形成了另外一个特点,那就是很多数据开始出现交叉,各个维度的数据从点和线渐渐连成了网,或者说,数据之间的关联性极大地增强,在这样的背景下,就出现了大数据,使得“以数据为中心”的思考解决问题的方式优势逐渐得到显现。

6.3.5 我为人人,人人为我 每个使用导航软件的智能手机用户,一方面共享自己的实时位置信息给导航软件公司(比如百度地图),使得导航软件公司可以从大量用户那里获得实时的交通路况大数据,另一方面,每个用户又在享受导航软件公司提供的基于交通大数据的实时导航服务。

6.4运用大数据思维的具体实例 6.4.1商品比价网站Decide.com 6.4.2啤酒与尿布 6.4.3零售商Target的基于大数据的商品营销 6.4.4吸烟有害身体健康的法律诉讼 6.4.5基于大数据的药品研发 6.4.6基于大数据的谷歌广告 6.4.7 搜索引擎“点击模型” 6.4.8 迪士尼MagicBand手环 6.4.9 谷歌流感趋势预测 6.4.10大数据的简单算法比小数据的复杂算法更有效 6.4.11谷歌翻译

6.4运用大数据思维的具体实例 思维方式 具体实例 全样而非抽样 商品比价网站Decide.com 谷歌流感趋势预测 效率而非精确 谷歌翻译 相关而非因果 啤酒与尿布 零售商Target的基于大数据的商品营销 吸烟有害身体健康的法律诉讼 基于大数据的药品研发 以数据为中心 基于大数据的谷歌广告 搜索引擎“点击模型” 大数据的简单算法比小数据的复杂算法更有效 我为人人,人人为我 迪士尼MagicBand手环

6.4.1商品比价网站Decide.com

6.4.2啤酒与尿布

6.4.3零售商Target的基于大数据的商品营销

6.4.4吸烟有害身体健康的法律诉讼

6.4.5基于大数据的药品研发

6.4.6基于大数据的谷歌广告

6.4.7 搜索引擎“点击模型”

6.4.8 迪士尼MagicBand手环

6.4.9 谷歌流感趋势预测 从谷歌流感趋势看大数据的应用价值 “谷歌流感趋势”,通过跟踪搜索词相关数据来判断全美地区的流感情况

6.4.10大数据的简单算法比小数据的复杂算法更有效

6.4.11谷歌翻译

附录A:主讲教师林子雨简介 主讲教师:林子雨 单位:厦门大学计算机科学系 E-mail: ziyulin@xmu.edu.cn 个人网页:http://dblab.xmu.edu.cn/post/linziyu 数据库实验室网站:http://dblab.xmu.edu.cn 扫一扫访问个人主页 林子雨,男,1978年出生,博士(毕业于北京大学),现为厦门大学计算机科学系助理教授(讲师),曾任厦门大学信息科学与技术学院院长助理、晋江市发展和改革局副局长。中国计算机学会数据库专业委员会委员,中国计算机学会信息系统专业委员会委员。国内高校首个“数字教师”提出者和建设者,厦门大学数据库实验室负责人,厦门大学云计算与大数据研究中心主要建设者和骨干成员,2013年度和2017年度厦门大学教学类奖教金获得者,荣获2017年福建省精品在线开放课程、2018年厦门大学高等教育成果特等奖、2018年福建省高等教育教学成果二等奖、2018年国家精品在线开放课程。主要研究方向为数据库、数据仓库、数据挖掘、大数据、云计算和物联网,并以第一作者身份在《软件学报》《计算机学报》和《计算机研究与发展》等国家重点期刊以及国际学术会议上发表多篇学术论文。作为项目负责人主持的科研项目包括1项国家自然科学青年基金项目(No.61303004)、1项福建省自然科学青年基金项目(No.2013J05099)和1项中央高校基本科研业务费项目(No.2011121049),主持的教改课题包括1项2016年福建省教改课题和1项2016年教育部产学协作育人项目,同时,作为课题负责人完成了国家发改委城市信息化重大课题、国家物联网重大应用示范工程区域试点泉州市工作方案、2015泉州市互联网经济调研等课题。中国高校首个“数字教师”提出者和建设者,2009年至今,“数字教师”大平台累计向网络免费发布超过500万字高价值的研究和教学资料,累计网络访问量超过500万次。打造了中国高校大数据教学知名品牌,编著出版了中国高校第一本系统介绍大数据知识的专业教材《大数据技术原理与应用》,并成为京东、当当网等网店畅销书籍;建设了国内高校首个大数据课程公共服务平台,为教师教学和学生学习大数据课程提供全方位、一站式服务,年访问量超过100万次。

附录B:大数据学习路线图 大数据学习路线图访问地址:http://dblab.xmu.edu.cn/post/10164/

附录C:《大数据技术原理与应用》教材 扫一扫访问教材官网 《大数据技术原理与应用——概念、存储、处理、分析与应用(第2版)》,由厦门大学计算机科学系林子雨博士编著,是国内高校第一本系统介绍大数据知识的专业教材。人民邮电出版社 ISBN:978-7-115-44330-4 定价:49.80元 全书共有15章,系统地论述了大数据的基本概念、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据 库HBase、NoSQL数据库、云数据库、分布式并行编程模型MapReduce、Spark、流计算、图计算、数据可视化以及大数据在互联网、生物医学和物流等各个领域的应用。在Hadoop、HDFS、HBase和MapReduce等重要章节,安排了入门级的实践操作,让读者更好地学习和掌握大数据关键技术。 本书可以作为高等院校计算机专业、信息管理等相关专业的大数据课程教材,也可供相关技术人员参考、学习、培训之用。 扫一扫访问教材官网 欢迎访问《大数据技术原理与应用——概念、存储、处理、分析与应用》教材官方网站:http://dblab.xmu.edu.cn/post/bigdata

附录D:《大数据基础编程、实验和案例教程》 本书是与《大数据技术原理与应用(第2版)》教材配套的唯一指定实验指导书 步步引导,循序渐进,详尽的安装指南为顺利搭建大数据实验环境铺平道路 深入浅出,去粗取精,丰富的代码实例帮助快速掌握大数据基础编程方法 精心设计,巧妙融合,五套大数据实验题目促进理论与编程知识的消化和吸收 结合理论,联系实际,大数据课程综合实验案例精彩呈现大数据分析全流程 清华大学出版社  ISBN:978-7-302-47209-4 定价:59元

附录E:《Spark编程基础(Scala版)》 厦门大学 林子雨,赖永炫,陶继平  编著 披荆斩棘,在大数据丛林中开辟学习捷径 填沟削坎,为快速学习Spark技术铺平道路 深入浅出,有效降低Spark技术学习门槛 资源全面,构建全方位一站式在线服务体系 人民邮电出版社出版发行,ISBN:978-7-115-48816-9 教材官网:http://dblab.xmu.edu.cn/post/spark/ 本书以Scala作为开发Spark应用程序的编程语言,系统介绍了Spark编程的基础知识。全书共8章,内容包括大数据技术概述、Scala语言基础、Spark的设计与运行原理、Spark环境搭建和使用方法、RDD编程、Spark SQL、Spark Streaming、Spark MLlib等。本书每个章节都安排了入门级的编程实践操作,以便读者更好地学习和掌握Spark编程方法。本书官网免费提供了全套的在线教学资源,包括讲义PPT、习题、源代码、软件、数据集、授课视频、上机实验指南等。

附录F:高校大数据课程公共服务平台 http://dblab.xmu.edu.cn/post/bigdata-teaching-platform/ 扫一扫访问平台主页 扫一扫观看3分钟FLASH动画宣传片

附录G:高校大数据实训课程系列案例教材 为了更好满足高校开设大数据实训课程的教材需求,厦门大学数据库实验室林子雨老师团队联合企业共同开发了《高校大数据实训课程系列案例》,目前已经完成开发的系列案例包括: 《基于协同过滤算法的电影推荐》 《电信用户行为分析》 《实时日志流处理分析》 《微博用户情感分析》 《互联网广告预测分析》 《网站日志处理分析》 系列案例教材将于2019年陆续出版发行,教材相关信息,敬请关注网页后续更新!http://dblab.xmu.edu.cn/post/shixunkecheng/ 扫一扫访问大数据实训课程系列案例教材主页

Department of Computer Science, Xiamen University, 2019