第四篇 数据处理 与数据分析 马秀麟 2015年11月.

Slides:



Advertisements
Similar presentations
实用农业科技写作 王鹏文. 第一章 导论 第一节 农业科技写作概述 一 、 农业科技写作概念和分类: 科技文献类、科技应用类、 科技普及类、科技新闻类 二、 农业科技写作的意义和重要性: 科技工作的重要组成部分、科学研究的手段、 科技成果的反映和标志、科技交流的工具 三、 农业科技写作的特点 : 功利性与及时性、科学性与先进性、读者的专门性与狭隘性、
Advertisements

新课程引领 实践中前行 —— 蓟县初中信息技术三年课改总结. 自从 2005 年秋季我市进入基础教育新一 轮课程改革实验以来,在市教研室的正 确领导下,我县初中信息技术课改工作 稳步推进。三年来,取得了一些成果, 也有不少体会。现将三年来的信息技术 课改工作总结如下。
台灣微軟公司 軟體顧問 台灣微軟公司 軟體顧問 洪士吉 編撰 洪士吉 編撰 台灣微軟公司 軟體顧問 台灣微軟公司 軟體顧問 洪士吉 編撰 洪士吉 編撰 運用 Excel 管理銀行帳戶與應收帳款.
河南省基础教育资源网 邓伟鹏 二〇一二年七月 内容大纲 1. 培训平台的目的 2. 培训平台介绍 3. 培训平台功能 4. 培训工作建立流程 5. 培训门户 6. 在线学习 6.1 课程学习 6.2 在线考试 7. 培训考试管理 7.1. 课程管理 7.2 必修学习班建立 7.3 在线考试管理 7.4.
桐乡市地方税务局 2013 年度社会保险费汇算清缴有 关政策及事项说明. 一、政策规定 根据《中华人民共和国社会保险法》、《桐乡市社会保险费征缴管 理办法》(市政府令第 42 号)、《 关于完善社会保险费征缴管理有关问 题的通知》(桐政办发 [2012]152 号)及《关于完善社会保险费征缴管理.
《公路纵断面设计》 —— 纵断面设计的要求 道桥系 二○○七年五月. 纵断面设计的一般要求 1 .纵坡设计必须满足《公路工程技术标准》中的各项规定。 2 .为保证汽车能以一定的车速安全舒顺地行驶,纵坡应具有 — 定 的平顺性,起伏不宜过大及过于频繁。尽量避免采用极限纵坡 值.缓和坡段应自然地配合地形设置,在连续采用极限长度的.
应用软件Excel 对外经济贸易大学信息学院.
NO.005 職涯 報 實習 徵才 攻讀 國立嘉義大學 學生事務處學生職涯發展中心.
國中教育會考 十二年國教—免試入學 及 意見整理.
探究实验的教学设计和教学策略 ENTER 余杭勾庄中学 郭 琳
13_01 Excel簡介與基本畫面 13_01_01 簡介 微軟公司的Excel軟體整合了試算表、商業統計圖表、資料庫管理等功能,除了可以做一般的計算工作外,另外還有許多內建函數,可以協助進行財務、統計、工程、管理科學上的分析與計算。
EXCEL使用教程 作者:十一楼 2012年8月.
第七讲 第3章 Office 2000_Excel 2000(二)
Ch04 第二類題目 電子試算表檢定.
薪資申報系統操作說明.
商学院 旅游管理专业介绍.
 历史以人类的活动为特定的对象,它思接万载,视通万里,千恣百态,令人销魂,因此它比其他学科更能激发人们的想像力。    
Excel在统计中的应用.
《数学》(华师大.八年级 下册) 第二十一章数据的整理与初步处理 扇形统计图的制作.
学校及托幼机构传染病等 突发公共卫生事件防控要求
怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 (学院、部门适用)
接著按下 F5 或按一下 [投影片放映] > [從首張投影片] 以開始課程。 在訊息列中,按一下 [啟用編輯],
计算机应用基础 Excel部分.
Excel 2003的操作与应用 Excel 2003简介 数据输入 单元格编辑 格式设置 数据管理 工作表的保护与打印.
第4章 Excel 2000的使用 主讲:.
第4章 电子表格软件Excel 2003 信息技术基础.
第二章 資料的蒐集與整理 授課教師: 更新.
“三项制度+一个平台”构建 省级高校教学质量监控体系
瓯海职专财经专业组简介.
忠孝國小自立午餐老師的叮嚀 教師指導手冊.
国有资产清查 数据填报操作规范 2016年3月25日.
第1章 计算工具EXCEL ——更有效地使用电子表软件
本章重點 6-1 以填滿方式輸入員工編號 6-2 計算總成績 6-3 員工成績平均分數 6-4 排列員工名次 6-5 查詢各個員工成績
电子表格软件Excel 2000 Excel 2000窗口的基本组成
计算机文化基础教程(第二版)(Windows XP + Office 2003)
医院资产分类对应工作交流会 2014年7月.
第三章 资料的统计描述 上一张 下一张 主 页 退 出.
第一章EXCEL高级应用 1.2 公式与函数的高级应用.
第五章 定积分及其应用.
第 9 章 函數的應用 著作權所有 © 旗標出版股份有限公司.
会计基本技能.
计算机基础知识 新疆乌恰县实验中学职业班计算机课件 授课老师:热斯别克.
Microsoft Excel 2000 試算表初階 中央大學 計算機中心 周小慧.
大学计算机应用基础.
Excel 2010高级使用技巧.
試算表軟體 II 醫務管理暨醫療資訊學系 陳以德 副教授: 濟世CS 轉
第8章EXCEL会计应用的基本方法 第9章EXCEL总账业务应用
電子試算軟體 以 MS EXCEL 為例.
专业教师成绩录入指南 及教学文档材料归档要求
第4章 Excel 2007电子表格.
網路遊戲版 幸福農場168號.
第九章 離散程度.
Excel 2007 操作培训—常用函数应用.
關鍵數據 數據錯了 扣 50分 排序錯了 扣50分.
Excel文書常用技巧 電算中心 薛明政 2012/10/22.
第5章 Excel 年1月. 第5章 Excel 年1月 1.电子表格的概念 1、电子表格的概念 (1)电子表格用途: (2)电子表格的版本 数据表格——强大的计算能力 数据库功能——数据检索与排序能力 图形功能——统计图,按照数据生成图形 (2)电子表格的版本.
國二EXCEL專案 上機考試版本: 主講者:黃韋欽 老師 考試者:國二全體學生.
Excel高级功能培训 PSMT质量部 王新民
計數函數 蕭世斌 Oct 9, 2010.
第十三章 財務預算管理 學習重點 SUMIF()函數 合併彚算功能應用.
第5章 使用試算表進行計算 在計算中使用公式 在計算中使用函數.
第八章 假设检验 关键词: 假设检验 正态总体参数的假设检验 拟合优度检验 1.
计算机应用基础 马秀麟 2012年10月.
第肆部份 Excel 試算表處理系統 Excel 試算表處理系統可用來製作如薪資表、銷貨表、電話簿之類的表格資料,表格除了可展示一般性的資料外,也可用來做數字性的資料的計算和分析,也可用來繪製圖表。 聯合.盧坤勇.
Excel 2007 电子表格基础知识.
大数据应用人才培养系列教材 数据清洗 刘 鹏 张 燕 总主编 李法平 主编 陈潇潇 副主编.
2014“瘦身世界”减肥冠军 英国阿什菲尔德的男子Stuart Eggleshaw因减肥22英石9磅(约280斤)而获冠军。
表格信息的加工与表达 ——函数的应用 06教育技术学 林晓凡.
第十三章 資料表格化與整理:Excel 2000的使用
通信设计中的Excel 函数应用 信通院: 蔡嘉兴.
Presentation transcript:

第四篇 数据处理 与数据分析 马秀麟 2015年11月

Excel的学习要点 编辑 格式设置 输入数值型量(含日期、货币) 输入字符串型量(含数值形态的字符串) 编辑栏的使用 边框与底纹、行高、列宽 自动换行,手工换行,合并居中 数值量的显示格式 条件格式

Excel的学习要点 计算功能 公式的制作 直接书写公式 基于函数的公式

Excel的学习要点 函数与公式 简单统计函数 复杂统计函数 日期函数 条件函数 字符串函数 Sum count (CountA) average max min 复杂统计函数 Sumif, countif averageif 日期函数 Year month day weekday now 条件函数 If 字符串函数 字符串连接运算符 & 字符串转换:text

Excel的学习要点 图形功能 统计图表 简单统计图 统计图的优化

Excel的学习要点 数据库功能 数据库拼合 排序、 筛选、 分类汇总、 频度分析 高级查找 =frequency() 基于子表的查找(标注) countif 子表的填充 vlookup

Excel的学习要点 数据分析基础(概念) 方法 相关性 方差齐性(非齐性) 差异性检验 方差检验 基于函数的操作 基于分析工具库的操作 Correl ftest Ttest 基于分析工具库的操作

第四章 Excel的使用 1、电子表格的概念 电子表格用途: 电子表格的版本 数据表格——强大的计算能力 数据库功能——数据检索与排序能力 图形功能——统计图,按照数据生成图形 电子表格的版本 Lotus 123(美国莲花公司) Excel 国内CCED

第四章 Excel的使用 1、电子表格的概念 基本组成 数据类型 工作簿(文档)——多个页面 工作表——一个页面,有标记 单元格——基本存储单位 区域——多个单元格构成的矩形区域 数据类型 字符型——以字母开头,或不符合数值格式且非公式 张三, 李四, ‘201212345678, 2012-2-31 数值型——以数码开头,且符合数值格式 日期、时间格式应该属于数值型 158,427,32E5, 2011-12-12, 2023/11/12

第四章 Excel的使用 2、Excel的单元格与区域 (1)单元格: (2)区域:H2..D8, HS98:IT77 (3)工作表范围: H8, D7, IV26等,可以包含数字、公式、字符串等。 (2)区域:H2..D8,     HS98:IT77 (3)工作表范围: Excel 2000/2003 : A1:IV65536 256列。 Excel 2007: A1:XFD104,8576 (4)工作表: 更改工作表名称,更改工作表标签颜色 (5)三维表示形式: sheet1!S2 工作表名!列号行号。

第四章 Excel的使用 2、数据输入与保存 (1)输入字符串数据: (2)输入数字 (3)输入公式 (4)数据编辑: 字符对齐方式——默认为左对齐 输入数值形态的字符串——使用前导符号英文但引号’ 长字符串行内换行<Alt>+<Enter> (2)输入数字 数码开头,符合数值习惯(比如日期格式) (3)输入公式 =号开始,或者使用工具栏按钮fx 公式中的字符型量,加英文双引号,例如“女”,人名等 所有控制符号,全部使用英文符号 (4)数据编辑: 直接编辑数据    利用编辑栏编辑数据

第四章 Excel的使用 3、数据格式设置 (1)设置文字格式 (2)设置边框底纹 (3)调整列宽、行高 (4)条件格式 字型、字号、字体、颜色、合并居中 (2)设置边框底纹    (含Excel网格的处理)——【页面布局】中 (3)调整列宽、行高 直接拖动标题中的“边界” (4)条件格式 (对符合条件的文字设置格式) 【开始】功能卡中。

第四章 Excel的使用 (5)设置数据显示格式——重点: (6)手工换行 【开始】-【数字】组-右下小箭头,“数字”选项卡,设置数值型数据:数值格式、日期格式 【开始】-【数字】组-右下小箭头【对齐】字符型数据:居中、左对齐、右对齐 (6)手工换行 <Alt>-<Enter>

第四章 Excel的使用 4、Excel中的计算功能 (1)常见函数及其使用 ①常规统计函数 求和:SUM(区域) 统计个数: COUNT(区域) 【数值型量】 COUNTA(区域) 【全体类型量】 求平均值: Average(区域)        求最大值: MAX(区域)   求最小值: MIN(区域) 条件统计:Countif(数据区域,条件), Sumif(条件区域,条件,求和区域) =countif(c2:c100,”女”) =sumif(c2:c100,”女”,f2:f100)

第四章 Excel的使用 ②条件函数: ③日期函数 IF(条件式,满足时的取值,不满足时的取值) =If(C3=“女”,500,10) =if(c3=“女”,if(f3>=80,1000,500),if(f3>=80,700,400)) 女生80分以上奖励1000,否则奖励500,男生80分以上奖励700,否则奖励400. ③日期函数 Year(日期), Month(日期), Now() =2010-year(d2) =(now()-d2)/365.25 =N2-N1 两个日期之间相差的天数(N1和N2中都存储日期量) Weekday(日期,2) 求指定日期为星期几?

第四章 Excel的使用 (2)使用公式计算 (3)复制公式 ①直接输入计算公式 ②输入带有函数的计算公式 填充方式复制: 利用剪贴板复制: 拖动填充柄 利用剪贴板复制: 选择单元格-【复制】,选择目标区域-【粘贴】

第四章 Excel的使用 在复制过程中,需要注意三种类型的公式: 相对坐标公式:形式为:列号行号。 绝对坐标公式:形式为:$列号$行号。 特点:公式被复制后将相应变动; =sum(A1:A8) 绝对坐标公式:形式为:$列号$行号。 特点:公式被复制后不会变动; =sum($A$1:A8) 混合坐标公式:形式为:行号和列号中仅有一个维度标记为$。 特点:公式被复制后,没有固定的维度发生变化。 =sum($A1:A$8)

第四章 Excel的使用 5、EXCEL的数据库功能 (1)Excel的数据库及其结构 ①Excel的标题行——字段名行

第四章 Excel的使用 (2)Excel下的数据排序 ①方法: ②注意事项 选定数据库区域,选择【数据】选项卡——【排序】, 再选择排序关键字,最后【确定】 ②注意事项 不要只选定一列排序关键字数据。 只要插入点在数据表区域,自动扩展

第四章 Excel的使用 (3)Excel的筛选功能 (1)自动筛选: 【数据】——【筛选】,启动【自动筛选】功能。  注意“筛选按钮”的使用;输入筛选条件 筛选的类型 针对“固定值”的筛选 符合范围的筛选(数值在一定范围之间) 模糊筛选 “包含”式的筛选 “指定格式”方式的筛选——带有通配符号

第四章 Excel的使用 (2)高级筛选: 设置筛选条件区域 一定包括字段名——建议从数据库字段名行复制字段名。 处于相同行的筛选条件为“与”的关系,处于不同行的筛选条件为“或”的关系。 设置输出区域 如果不另外指定输出区,可不设置输出区域 【数据】—【筛选】组块,单击【高级】,选择数据库区域, 选择条件区域, 选择输出区域,【确定】

第四章 Excel的使用 (4)分类汇总 ①分类汇总的含义:分组,计算(总计,求和,求最大,求最小)。 ②方法: ③注意事项: 选定数据库区域,选择【数据】—【分类汇总】, 再选择“分类字段”,选择“计算方式”,选择“被计算字段”,最后【确定】 ③注意事项: 只有分类字段值有序后才能正确地分类汇总 一定要先根据分类字段排序

第四章 Excel的使用 (5)频度分析 什么是频度分析 频度分析的方法与特点 对于待统计的数据样本,检查在每个分段中的频数。 例如:统计不及格、及格、良好、优秀的人数 频度分析的方法与特点 设定分段数据 n个数把数轴分为n+1段,采用上包含关系(<=) 如果需要实现>=类型的量,需做分段数据转换 集合函数 结果为多个值的集合函数 先选定结果区域,再输入公式,最后<Ctrl>+<Shift>+<Enter>

第四章 Excel的使用 公式的格式 操作实例 选定结果区域,——切切注意 =Frequency(样本区域,分段区域) 按住<Ctrl>+<Shift>,敲击<Enter> 操作实例

第四章 Excel的使用 6、EXCEL的图形功能 (1)作图方法 ③利用功能区的“设计”“布局”对图表属性进行设置 ①选定作图依据的区域 连续区域 非连续区域的选择 ②命令 【插入】【图表】,选择图标类型; 直接插入图表; (图表会按照数据源变化与调整)。 ③利用功能区的“设计”“布局”对图表属性进行设置 注意:(不能用绘图工具制作图表)。

第四章 Excel的使用 (2)图形的存在方式 (3)修改图表的信息 存在方式 改变位置 “设计”功能卡——最右侧“位置” ①独立图形 ①独立图形              ②嵌入式图形 改变位置 “设计”功能卡——最右侧“位置” (3)修改图表的信息 “设计”选项卡 图表类型(折线图、柱型图等) 行列方式 图表样式 “布局”选项卡 (标题、坐标轴、网格线) (图例(位置)、数据标志、数据表)

第五章 子表数据处理 子表数据处理的概念 依据子表实现数据筛选 依据大表数据填充子表 数据的归类

第五章 子表数据处理 countif——用于检查数据是否在某一列中存在 用法 特点 实际应用 Countif(列名:列名,单元格名) 例如: Countif(A:A,B2)——用于检查B2是否在A列存在 特点 本函数可以被复制,用于快速找到属于另一个集合的数据。 实际应用 基于子表,对大表中的记录进行标记; 以便筛选出属于子表的全部记录

第五章 子表数据处理 对于用法2: Lookup函数——用于归类计算 用法: Lookup(单元格,序列区域,取值区域) 例如:lookup(h4,{0,60,80,90},{0,200,500,1000}) Lookup(单元格,序列区域) 注意: 序列范围必须递增 对于用法1: 根据h4落在序列范围内的位置,确定其在取值区的对应值。 若h4在(0~60),则对应于第一个值0,在60-80之间,则对应200。…… 对于用法2: 把取值范围与序列区域合并了,自动取其低值。

第五章 子表数据处理 实际应用 基于大表, 对子表中的某些字段进行填充。 Vlookup函数——用于查找特定数据 用法: 例如:vlookup(b3,$b$3:$h$100,4,true) 注意: 被查找值应在查找区域的首列 返回值的列序号以区域为准。在上例中为e列 查找区域常常使用绝对坐标 实际应用 基于大表, 对子表中的某些字段进行填充。

第六章 Excel的数据分析 1.基本概念 (1)数据描述 集中性描述 离散性(波动性)描述 均值 中位数与众数 离差 样本值与均值的差 方差 总体方差 ——分母为总体个数n,【VARP】 样本方差 ——分母为自由度n-1, 【VAR】 标准差

第六章 Excel的数据分析 分布形态描述 多组数据的关系描述 正态分布 非正态分布 是否存在对应关系 方差齐性描述 配对样本 通常为对同一组被试的多次测量(一一对应地记录下来) 独立样本 不存在对应关系的多个数据集合,可能来自基于某一因素的分组,也可能不是 方差齐性描述 两组数据方差的差异不显著。称为方差齐性 (FTEST) 策略 假设方差为齐性的, 若检验概率》0.05,则假设成立 若检验概率<0.05,则假设不成立

第六章 Excel的数据分析 (2)数据分析技术 关联系分析 数据应满足的条件 类型 多组数据 配对(至少有序) 不相关 相关——相关系数 注意方法:Pearson相关 与 Spearman相关 具有函数关系——回归分析

第六章 Excel的数据分析 差异显著性性分析 概念 用途 定义:判断多组数据之间的差异是否很显著 策略:组间均值差异>>组内波动差异? 用途 对比多组数据之间的差异是否很显著 若多组数据基于某个因素产生,则可用于归因。

第六章 Excel的数据分析 类型 正态数据 2组数据——t检验 多组数据 非正态分布数据 非参数检验 配对样本 独立样本 方差非齐性——检验 多组数据 基于同一因素产生的分组——方差分析 基于不同因素产生的分组——两两组合T检验 非正态分布数据 非参数检验

第六章 Excel的数据分析 2.基本数据分析 标准差——估算标准差(样本标准差) 方差——估算方差(样本方差) 相关性分析: STDEV(区域),返回标准偏差,忽略文本和逻辑值 STDEVA(区域),返回标准偏差,不忽略文本和逻辑值 分母为自由度n-1。 方差——估算方差(样本方差) VAR(区域),计算给定数据的方差,忽略文本和逻辑值差异性分析 相关性分析: =Correl(区域1,区域2) 判断两列数据是否相关,结果为相关性系数。 |相关性系数|>0.4为相关, |相关性系数|>0.8为高度相关 STDEVP和VARP 总体标准差与总体方差 公式中分母为:n.

第六章 Excel的数据分析 3.高级数据分析 方差齐性检验——F检验 作用: 公式 返回方差无明显差异时的双尾概率, 若<0.05,则方差非齐次,即异方差 公式 FTEST(区域1,区域2) 例如:Ftest(A1:A100, B2:B200) 结论:<0.05: 异方差, >0.05:等方差

第六章 Excel的数据分析 两组数据的差异显著性检验——T检验: 作用 公式 解释 返回两列数据均值没有差异的概率值 若<0.05,则两列数据有显著性差异 公式 TTEST(区域1,区域2,单侧/双侧,检验类型) 单侧——1,双侧——2 配对检验——1,独立样本等方差——2,独立异方差——3 解释 单侧/双侧 双侧:两列数据是否在双侧都没有显著性差异,主要用于判定是否相等 单侧:两列数据在单侧是否差异显著,主要用于判断甲列数据是否明显地高于乙列,或者低于乙列。 类型 先判断是否配对样本 对于独立样本,应该先用F检验判定其方差是否齐性

第六章 Excel的数据分析 操作方法: 先确立研究目标是什么? 确定两组数据的类型 两者有无差异性,是否显著差别,用“双侧” 两者A和B,若判断A>B或A<B,则用“单侧” 确定两组数据的类型 若为配对样本 TTEST的第4个参数直接使用“1” 若为独立样本 用FTEST检查两组数据的方差是否齐性 若结果》0.05, 则检验方式用2;(独立样本等方差) 若结果<0.05, 则检验方式用3;(独立样本异方差)

第六 Excel的数据分析 4. 基于分析工具库的数据分析 分析工具库的概念 启用分析工具库 Excel提供的专业化数据分析工具 利用【文件】—【选项】 【加载项】—【管理加载项】 把“分析工具库”前的复选框设置为有效

第六 Excel的数据分析 利用分析工具库实施数据分析 相关性分析 【数据】—【数据分析】 相关系数

第六 Excel的数据分析 两样本的差异显著性检验(t检验) 首先判断检验的类型 配对样本 独立样本 方法 【数据】—【数据分析】 Ftest函数 得到 等方差 || 异方差 方法 【数据】—【数据分析】 选择具体方法: 平均值的成对2样本分析 ||双样本等方差假设 ||双样本异方差假设独立样本的T检验

第六 Excel的数据分析 多组样本的差异显著性检验(方差分析) 基本条件 方法 作用 整个数据大致满足正态分布 基于某个因素分为多组 多组数据的方差齐性 方法 【数据】——【数据分析】 【方差分析:单因素方差分析】 作用 直接作用:判断多组数据之间是否存在显著性的差异 间接作用:归因,分析单因素是否是影响结论的关键指标

谢谢大家 马秀麟