大数据应用人才培养系列教材 Python语言 刘 鹏 张 燕 总主编 李肖俊 主编 刘 河 钟 涛 副主编.

Slides:



Advertisements
Similar presentations
環境游離輻射 ( 六 ) 輻射與核能發電. 媽!這是我上班的 地方-核電廠。 地方好寬闊喔! 聽說日本原子彈爆炸死好幾 萬人,阿榮啊!你在這裡上 班,安全嗎?
Advertisements

《小狗包弟 》之 从阅读到写作 学校:和风中学 年级:高一 参赛者:彭龙英. 预习检测一 思考:同学们读完作者与包弟 的故事后,说一说作者所表达的情 感是什么?
幾米 作業 1 飛上天空 我想飛上天空 遨遊在無際的天空 美麗的天空 漂亮的天空 這終究只是夢…… (李高仰)
虹膜识别健康养老服务智能系统项目.
探究活动课:互联网+历史素材阅读与研讨 古代中国的选官制度 黄天庆  探究活动课:互联网+历史素材阅读与研讨 古代中国的选官制度 黄天庆 
学习全国“两会”精神 常州工学院  理学院党总支 2014年3月.
乘势而上再谱发展新篇章 -2012全国两会精神解读
开启新征程 点燃中国梦 开启新征程 点燃中国梦 ——学习、领会2013年全国“两会”精神.
報告書名:父母會傷人 班級:二技幼四甲 姓名:吳婉如 學號:1A2I0034 指導老師:高家斌
職校、五專群科簡介.
第三项APP 接球游戏.
江苏省工程造价管理协会 工作报告 2015年4月21日 扬州.
媽,我們真的不一樣 青少年期與中年期 老師: 趙品淳老師 組員: 胡珮玟4A1I0006 馬菀謙4A1I0040
一、平面点集 定义: x、y ---自变量,u ---因变量. 点集 E ---定义域, --- 值域.
各位弟兄姐妹,主內平安! 請將手機關靜音,帶著敬虔的心來到上帝的面前!
101年8月份 嘉義市道路交通安全聯席會報 酒駕行為與肇事現況分析 主講人:內政部警政署交通組科長張夢麟 1.
高校邦在线学习平台 学生学习手册 北京高校邦科技有限公司.
第一节 呼吸道对空气的处理.
十面“霾”伏 湖南长沙民政职业技术学院“思政”第九组 组员:李亮亮 许静 赵凯丽 何敏 张艳欣 付幻菱 陈京萍 王诗雨.
如何对付脏空气.
班級:二幼三甲 姓名:郭小瑄 、 詹淑評 學號:1A2I0029 、1A2I0025
個人投資理財分析 財務狀況匯總表 銀行存款 共同基金 外幣基金 股票投資 保險價值 黃金投資 支出預算 房貸計算 不動產價值 資源變化資料庫
教師執行計畫案聘任助理說明會 (勞務型、學習型申請方式說明)
管理学基本知识.
指導老師:陳韻如 姓名:吳宜珊 學號:4A0I0911 班級:幼保二乙
水腫的原因 徐淑娟護理師 PM.
中国未成年人法制安全课程 雾霾哪里来? 初中段 第七讲.
滁州学院首届微课程教学设计竞赛 课程名称:高等数学 主讲人:胡贝贝 数学与金融学院.
运用Matlab GUI辅助大学物理实验 蒋志洁 中山大学 物理学院
傳統童玩遊戲創新 組別:第八組 班級:幼保二甲 組員: 4A0I0005柯舒涵 4A0I0011謝孟真
103學年度第1階段 志願選填試探後輔導作為 成效檢討與精進建議
活动主题:佛山智造 中国骄傲 随着互联网、云计算、大数据以及移动互联网的快速发展,技术不仅仅是一种工具,正加速重构着品牌的新格局。
拾貳、 教育行政 一、教育行政的意義 教育行政,可視為國家對教育事務的管理 ,以增進教育效果。 教育行政,乃是一利用有限資源在教育參
科學科 污染 空氣 成因 的 : 題目 及 減少空氣污染的方法 陳玉玲 (4) 姓名 : 去到目錄.
課程銜接 九年一貫暫行綱要( )  九年一貫課程綱要( ) 國立台南大學數學教育系 謝 堅.
2.4 二元一次方程组的应用(1).
四川省卫生监督移动 执法终端介绍 发言人:陈成身 四川省卫生执法监督总队.
獎補助經預計支用報告 105年.
何俊賢教學資料.
Python金融数据分析教程 解放你的python编程能力 第6关金融数据的统计分析 Python金融数据分析教程 1.
电磁学小论文 —— 带电粒子在电磁场中运动的计算机模拟程序的简单实现
华东理工大学 关于新校园卡功能启用的相关说明 2018年09月07日.
用Python建模与数据处理 俞熹 2017/1.
Python Final Project Hello Idol
人工智慧應用蟲體辨識 亞洲大學 資訊工程學系 學生:殷聖展、廖哲毅、吳京育 指導教授:蔡志仁 教授
SAGE 《系统数理基础》课程汇报 地理科学学部 地理信息科学 陈晓
102學年度下學期 班親會 五年仁班 楊曉逸老師.
第二階段「校園徒步區建置」 執行成果報告.
高级大数据人才培养丛书之一,大数据挖掘技术与应用
花蓮縣校園空氣品質旗幟操作說明 6/1/2019.
大数据应用人才培养系列教材 R 语言 刘 鹏 张 燕 总主编 程显毅 主编 刘颖 朱倩 副主编.
大数据应用人才培养系列教材 Python语言 刘 鹏 张 燕 总主编 李肖俊 主编 刘 河 钟 涛 副主编.
DIGI+ Talent 必修課程 課程內容 & 補修辦法說明.
大数据应用人才培养系列教材 Python语言 刘 鹏 张 燕 总主编 李肖俊 主编 刘 河 钟 涛 副主编.
大数据应用人才培养系列教材 数据清洗 刘 鹏 张 燕 总主编 李法平 主编 陈潇潇 副主编.
高级大数据人才培养丛书之一,大数据挖掘技术与应用
数据挖掘 DATA MINING 刘 鹏 张 燕 总主编 王朝霞 主编 施建强 杨慧娟 陈建彪 副主编
第6课 我是共和国的公民.
大数据应用人才培养系列教材 R 语言 刘 鹏 张 燕 总主编 程显毅 主编 刘颖 朱倩 副主编.
高级大数据人才培养丛书之一,大数据挖掘技术与应用
大数据应用人才培养系列教材 数据挖掘基础 刘 鹏 张 燕 总主编 陶建辉 主编 姜才康 副主编.
為民服務白皮書 台灣電力公司彰化區營業處  彰化區營業處 為民服務白皮書 誠信 關懷 服務 成長 1.
大数据应用人才培养系列教材 数据挖掘基础 刘 鹏 张 燕 总主编 陶建辉 主编 姜才康 副主编.
正弦函数余弦函数的性质 (二) 执教:湖南华容一中 黄奇卫老师.
用加減消去法解一元二次聯立方程式 台北縣立中山國中 第二團隊.
实验课程学习手册.
云控APP说明书 适用于云控平台配置.
云控APP说明书 适用于云控平台配置.
大数据应用人才培养系列教材 数据清洗 刘 鹏 张 燕 总主编 李法平 主编 陈潇潇 副主编.
Presentation transcript:

大数据应用人才培养系列教材 Python语言 刘 鹏 张 燕 总主编 李肖俊 主编 刘 河 钟 涛 副主编

第十二章 项目实战:数据可视化 12.1 Matplotlib简介 12.2 Artist模块介绍 12.3 Pandas绘图 大数据应用人才培养系列教材 第十二章 项目实战:数据可视化 12.1 Matplotlib简介 12.2 Artist模块介绍 12.3 Pandas绘图 12.4 词云图

12.1 Matplotlib简介 第十二章 项目实战:数据可视化 概述 Matplotlib是基于Python语言的开源项目,旨在为Python提供一个数据绘图包。它提供了一整套和matlab类似的命令API,适合交互式地进行制图。并且可以方便地将其作为绘图控件,嵌入GUI应用程序中。它的文档相当完备,并且Gallery页(https://matplotlib.org/gallery.html)中有上百幅缩略图,打开之后都有源程序。因此如果你需要绘制某种类型的图,只需要在这个页面中浏览..>选择图像..>打开..>复制..>粘贴一下,基本上都能搞定。本节作为matplotlib的入门,主要介绍 matplotlib绘图的一些基本概念和基本操作。

12.1 Matplotlib简介 Pyplot模块介绍 第十二章 项目实战:数据可视化 Pyplot模块介绍 俗话说的好“熟读唐诗三百首,不会作诗也会吟”,模仿是最好的老师,编写程序也不例外。这里,我们首先通过matplotlib自带的gallery.html 页面中的案例了解绘图程序的基本架构,然后,借助归纳的框架为原型编写程序。

12.1 Matplotlib简介 Pyplot模块介绍 第十二章 项目实战:数据可视化 Pyplot模块介绍 俗话说的好“熟读唐诗三百首,不会作诗也会吟”,模仿是最好的老师,编写程序也不例外。这里,我们首先通过matplotlib自带的gallery.html 页面中的案例了解绘图程序的基本架构,然后,借助归纳的框架为原型编写程序。

12.1 Matplotlib简介 Pyplot模块介绍 然后,复制demo中的代码,至Python shell中运行,结果如下图: 第十二章 项目实战:数据可视化 Pyplot模块介绍 然后,复制demo中的代码,至Python shell中运行,结果如下图:

12.1 Matplotlib简介 Pyplot模块介绍 第十二章 项目实战:数据可视化 Pyplot模块介绍 分析如上demo示例代码,我们不难得出matplotlib绘图程序的 基本结构,包含如下六个部分: ◎分别导入模块 matplotlib.pyplot 、numpy。 ◎定义横轴标度并以横轴标度为自变量定义纵轴功能函数。 ◎通过figure()函数指定图像的长宽比。 ◎通过plot()函数绘制功能函数。 ◎通过plt的属性函数设置图像属性。 ◎通过show()函数显示图像。

12.1 Matplotlib简介 第十二章 项目实战:数据可视化 Pyplot模块介绍 案例:绘制正余弦曲线。

12.1 Matplotlib简介 第十二章 项目实战:数据可视化 Pyplot模块介绍 程序运行结构示意图:

12.1 Matplotlib简介 plot()函数 第十二章 项目实战:数据可视化 plot()函数 在绘制正余弦函数图时,我们调用了Matplotlib的plot()函数。该 函数主要用于在figure绘制对象中绘制各种曲线,其调用形式灵活, 可用其参数指定其显示风格。下面的程序代码是通过调用plot函数进 行曲线绘图的:

12.1 Matplotlib简介 plot()函数 第十二章 项目实战:数据可视化 plot()函数 由以上代码可以看出,plot()常用的参数包括坐标数据,格式参数。标准格 式是plt.plot(x,y,format_string,**kwargs) 。x轴数据,y轴数据,format_string 控制曲线的格式字串 format_string 由颜色字符、风格字符、和标记字符构成。 现介绍其格式参数含义分别如下: label : 用于给所绘制的曲线定义名称,此名字在图示中显示。只要在字符串 前后添加''$''符号,matplotlib就会使用其内嵌的latex引擎绘制的数学公式。 color : 指定曲线的颜色。常用的颜色字符有蓝色(‘b’)、绿色(‘g’)、红 色(‘r’)、青绿色(‘c’)、洋红色(‘m’)、黄色(‘y’)、黑色(‘k’)、白色 (‘w’)、灰度值字串(‘0.8’)其取值范围“0~1”、RGB颜色值(‘#008000’) linewidth : 指定曲线的宽度。 b..:指定曲线的颜色和线型,这个参数称为格式化参数,它能够通过一些易 记的符号快速指定曲线的样式。 常用的线型有实线’.’、破折线’..’、点画 线’..’、虚线’:’、无线条’’’’。

12.1 Matplotlib简介 第十二章 项目实战:数据可视化 绘制子图 在Matplotlib中用轴表示一个绘图区域,一个绘图对象(figure)可 以包含多个轴(axis),我们可以将其理解为子图。上面绘制正余弦的例 子中,绘图对象只包括一个轴,因此只显示了一个轴。我们可以使用 subplot函数快速绘制有多个轴的图表。其默认的函数调用格式如下: subplot(numRows, numCols, plotNum) Subplot 通过numRows、numCols两个参数将绘图区域划分为 numRows*numCols个子区域,然后按照从左到右,从上到下的顺序 对每个子区域进行编号,并且子图的编号从1开始。

12.1 Matplotlib简介 绘制子图 下面,我们通过subplot函数对正余弦函数图像使用子图绘制,程序 代码如下: 第十二章 项目实战:数据可视化 绘制子图 下面,我们通过subplot函数对正余弦函数图像使用子图绘制,程序 代码如下:

12.1 Matplotlib简介 第十二章 项目实战:数据可视化 绘制子图

12.1 Matplotlib简介 第十二章 项目实战:数据可视化 添加标注 标注又称注释, 是在matplotlib所绘制的图像中,为了使用户方 便理解图像的含义而添加的注释性文字。其类似于程序编写中程序员 为了提高代码的可读性,给代码所添加的注释性语句。给图像添加标 注的根本目的是提高图像的可读性,增强和使用者的可交互性。 通常,使用text()函数可将文本放置在轴域的任意位置,用来标注 绘图的某些特征。我们用annotate()方法提供辅助函数进行定位,使 标注变得准确、方便。做标注时,文本的位置、和标注点的位置。均 由元组(x,y)构成。其中参数xy表示标注点的位置位,参数xytext表 示文本位置。

12.1 Matplotlib简介 第十二章 项目实战:数据可视化 添加标注

12.1 Matplotlib简介 第十二章 项目实战:数据可视化 添加标注

12.1 Matplotlib简介 Pylab模块应用 第十二章 项目实战:数据可视化 Pylab模块应用 Matplotlib还提供了一个名为pylab的模块,它是一款由python 提供的可以绘制二维,三维数据的工具模块,可以生成matab绘图库 的图像。另外,它包括了许多NumPy和pyplot模块中常用的函数, 方便用户快速的进行计算和绘图,十分适合在Python Shell交互式环 境中使用。本小节,我们来简单介绍一下pylab模块的使用方法。 通常,在我们安装matplotlib时,该模块已默认完成安装。因而 无需单独进行安装操作。

12.1 Matplotlib简介 第十二章 项目实战:数据可视化 Pylab模块应用 运用pylab 模块绘制正弦函数。

12.1 Matplotlib简介 第十二章 项目实战:数据可视化 Pylab模块应用

第十二章 项目实战:数据可视化 12.1 Matplotlib简介 12.2 Artist模块介绍 12.3 Pandas绘图 大数据应用人才培养系列教材 第十二章 项目实战:数据可视化 12.1 Matplotlib简介 12.2 Artist模块介绍 12.3 Pandas绘图 12.4 词云图

12.2 Artist模块介绍 第十二章 项目实战:数据可视化 概述 Matplotlib绘图库的API包含三个图层,其含义分别如下: backend_bases.FigureCanvas(画板)、backend_bases.Renderer(渲染)、 artist.Artist(如何渲染)。相比前两个API而言,Artist用于处理所有的高层结构, 例如处理图表、文字和曲线等的绘制和布局。通常我们只和Artist打交道,而不需 要关心底层的绘制细节。 Artists分为简单类型和容器类型两种。简单类型的Artists为标准的绘图元件, 例如Line2D、 Rectangle、 Text、AxesImage 等等。而容器类型则可以包含许多 简单类型的Artists,使它们组织成一个整体,例如Axis、 Axes、Figure等。 通常,使用Artists创建图表的标准流程包含一下三个步骤: ◎创建Figure对象。 ◎用Figure对象创建一个或者多个Axes或者Subplot对象。 ◎调用Axies等对象的方法创建各种简单类型的Artists。

12.2 Artist模块介绍 第十二章 项目实战:数据可视化 概述 Artist 安装:

12.2 Artist模块介绍 第十二章 项目实战:数据可视化 概述 下面我们通过一个简单的例子,对artist 库的使用进行简单介绍,该示例中,依据Artists创建图表的标准流程三步走完成正弦函数sin(x)的绘制。注意在使用Figure对象创建subplot对象时,若只有一个子图,则其参数为(1,1,1)。

12.2 Artist模块介绍 第十二章 项目实战:数据可视化 概述

12.2 Artist模块介绍 第十二章 项目实战:数据可视化 属性 Matplotlib所绘制的图表中的每一个元素都由Artist控制,而每个Artist对象都有一大堆属性控制其显示效果。比如,figure对象包含了Rectangle实例,它可以设置背景颜色和透明度。同样的Axes也含有。这些实例被储存在Figure.patch.和Axes.patch中。

12.2 Artist模块介绍 第十二章 项目实战:数据可视化 属性 Artist对象的所有属性都通过相应的 get_* 和 set_* 函数进行读写,例如下面的语句将alpha属性设置为当前值的一半: fig.set_alpha(0.5*fig.get_alpha()) 如果你想用一条语句设置多个属性的话,可以使用set函数: fig.set(alpha=0.5, zorder=2,lable=’$sin(x)$’)

第十二章 项目实战:数据可视化 12.1 Matplotlib简介 12.2 Artist模块介绍 12.3 Pandas绘图 大数据应用人才培养系列教材 第十二章 项目实战:数据可视化 12.1 Matplotlib简介 12.2 Artist模块介绍 12.3 Pandas绘图 12.4 词云图

12.3 Pandas绘图 第十二章 项目实战:数据可视化 简介 Pandas 是python下最强大的数据分析和探索工具,它包含高级的数据结构和精巧的工具,使得在Python中处理数据简单快捷。Pandas构建在Numpy之上,使得以Numpy为中心的应用更便捷。Pandas功能强大,支持类似与SQL的数据操作,并且带有丰富的数据处理函数。Pandas 统计作图函数依赖于Matplotlib,因而,通常与Matplotlib函数一起使用。本节我们将对Pandas 库的安装和其统计作图函数进行简单介绍。

12.3 Pandas绘图 第十二章 项目实战:数据可视化 安装 pip install pandas。

12.3 Pandas绘图 第十二章 项目实战:数据可视化 使用 为了能够熟练的掌握Pandas 的使用,在学习如何使用Pandas绘图之前,大家首先需要了解其自带的两个重要的数据结构:数据框(DateFrame)和系列(Series)。使用这种数据结构,你便可很容易的在计算机内存中构建虚拟的数据库。 ◎数据框:和关系数据库中的二维表类似, 由行和列构成。通常,行和列都有各自的索引。使用索引,便可以快速的定位到要访问的数据框中的数据(行,列)。在数据框中,面向行的操作和面向列的操作是对称的。创建数据框的方式很多,我们常用包含相等长度的列表的字典或Numpy数组来创建数据框。以列表字典为例,创建数据框示例如下:

12.3 Pandas绘图 第十二章 项目实战:数据可视化 使用

12.3 Pandas绘图 第十二章 项目实战:数据可视化 使用 如上代码所示,生成一张考生成绩二维表。行索引默认由0开始,列索引由用户自定义,也即对应字段名称。另外,我们也可以显性的对行索引进行自定义,在上面代码基础之上添加如下语句:

12.3 Pandas绘图 第十二章 项目实战:数据可视化 使用 系列:通常是对具有同一属性的值的统称。我们可以将其理解为一个一维数组,也即退化了的数据框。默认情况下,系列的索引是自增非负整数数列。如上示例,我们可以通过系列获取具有同一属性的某一列记录,比如姓名Name 。示例如下:

12.3 Pandas绘图 第十二章 项目实战:数据可视化 使用 另外,数据框可以看作是字典类型,其对数据本身的的增、删、改、查与Python中字典的操作类似,这里就不再赘述。 接下来,我们来了解一下如何使用Pandas库中的函数绘制图表。

12.3 Pandas绘图 第十二章 项目实战:数据可视化 使用 我们用饼图来统计学生成绩等级占比图:

12.3 Pandas绘图 第十二章 项目实战:数据可视化 使用

第十二章 项目实战:数据可视化 12.1 Matplotlib简介 12.2 Artist模块介绍 12.3 Pandas绘图 大数据应用人才培养系列教材 第十二章 项目实战:数据可视化 12.1 Matplotlib简介 12.2 Artist模块介绍 12.3 Pandas绘图 12.4 词云图

12.4 词云图 第十二章 项目实战:数据可视化 简介 “词云”这个概念由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)提出的。戈登做过编辑、记者,曾担任迈阿密先驱报(Miami Herald)新媒体版的主任。他一直很关注网络内容发布的最新形式——即那些只有互联网可以采用而报纸、广播、电视等其它媒体都望尘莫及的传播方式。通常,这些最新的、最适合网络的传播方式,也是最好的传播方式。 词云图是数据分析中比较常见的一种可视化手段。词云图又称文字云,是对文本数据中出现频率较高的关键词用图像的方式以视觉上的突出展示,形成"关键词的渲染"。将文字制作成类似“云”一样的彩色图片,从而过滤掉大量的文本信息,使人一眼就可以领略文本数据的主要表达意思。这里为了更好直观形象的理解词云图,我们先来感受一下百度中常见的文字云。

12.4 词云图 第十二章 项目实战:数据可视化 简介

12.4 词云图 第十二章 项目实战:数据可视化 思路解析 作为一个球迷,2018世界杯进行的如火如荼,热搜榜上那些词语点击率高呢?我们怎么样才能快速的直观的获取相关的热点信息呢?本小节,我们将用Python中词云图的展示方法,为大家展现2018世界杯的热点词语图像描述。 1.任务要求 ◎了解Python第三方库分词包(jieba)、词云包(WordCloud)的基本使用方法。 ◎以《2018世界杯球迷趋势分析报告》为分析对象,基于Python环境搭建词云图开发环境,完成此文本的词云图分析。 2.环境要求 词云图程序的正常运行需要安装如下Python 第三方常用库:matplotlib、Numpy、pandas、codecs,另外还要安装词云图程序开发的专用库:jieba(分词包),WordCloud(词云包)。

12.4 词云图 第十二章 项目实战:数据可视化 代码实现

12.4 词云图 第十二章 项目实战:数据可视化 代码实现

12.4 词云图 第十二章 项目实战:数据可视化 运行结果

AIRack人工智能实验平台 ——一站式的人工智能实验平台 DeepRack深度学习一体机 ——开箱即用的AI科研平台 BDRack大数据实验平台——一站式的大数据实训平台

云创公众号推荐 刘鹏看未来 云计算头条 中国大数据 深度学习世界 云创大数据订阅号 云创大数据服务号 高校大数据与人工智能 微信号:lpoutlook 云计算头条 微信号:chinacloudnj 中国大数据 微信号:cstorbigdata 深度学习世界 微信号:dl-world 云创大数据订阅号 微信号:cStor_cn 云创大数据服务号 微信号:cstorfw 高校大数据与人工智能 微信号:data_AI

手机APP推荐 我的PM2.5 随时随地准确 查看身边的 PM2.5值 同声译 支持26种语言 互译的实时翻 译软件 我的南京 云创大数据为路 况大数据应用提 供技术支持 科技头条 汇聚前沿资讯 的科技情报站

网站推荐 万物云 智能硬件大数据免费托管平台 环境云 环境大数据开放共享平台

感谢聆听