Dr. Baokun Li 经济实验教学中心 商务数据挖掘中心

Slides:



Advertisements
Similar presentations
減重藥膳與耳穴 台北市立聯合醫院 陽明院區 中醫科 林俐嘉 醫師 一、肥胖定義 1.BMI 超過 24─ 體重過重;超過 27─ 肥胖 BMI ( Body Mass Index ,身體質量指數)它是 身高與體重之間關係的一種指標,數值越大代表 一個人越胖。 個人體重(公斤)除以身高(公尺)兩次,就是.
Advertisements

設計者:陳麗妃 台南市新化國中 健康促進議題 --- 均衡飲食 與健康體 位. 一、均衡飲食  全穀根莖類  蔬菜類  水果類  豆魚肉蛋類  低脂奶類  油脂與堅果類  醣類  脂肪  蛋白質  維生素  礦物質  水 *六大類食物*六大類營養.
怎樣才算「識飲識食」? 適當 適量 在日常生活中進食 適當 和 適量 的食物 和飲料。 何謂「適當」? 1. 不偏食,選擇不同種類的食物和飲料, 以吸收不同的營養素。 2. 多進食營養價值高的食物。 3. 避免進食熱量、脂肪、糖份、鹽份和膽 固醇含量過高的食物,以及加工食品 ( 如 罐頭和即食麵.
2007 年广州市初中信息技术 结业考试海珠区质量分析 海珠区教育发展中心 范谊 2007 年 9 月 8 日.
你把什麼喝下肚 ? 竹林國小 99 年 4 月 22 日 延杰股份有限公司 營養師:楊雅雯. 你最喜歡喝哪一瓶 ??
均衡飲食與健康體位 逸馨園 營養師 鍾筱薇.
第二章 SPSS的基本操作 2-1 SPSS 的簡介 2-2 SPSS 軟體的功能表介紹 2-3 資料的輸入 2-4 資料的分析與輸出結果
SPSS 軟體與統計應用 Ya-Yun Cheng, How-Ran Guo
SPSS系统教程.
第二章 语言测试的功能与分类 湖南师范大学外国语学院 邓 杰 教授.
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
Measures of location and dispersion
第一章 生物统计学基本知识 1、明确统计在做什么事情、将用什么样的方式去做。 2、生物统计与统计学的关系,其涉及哪些内容 1.
前言 MINITAB 是为质量改善、教育和研究应用领域提供统计软件和服务的先导。是一个很好的质量管理和质量设计的工具软件,更是持续质量改进的良好工具软件。 MINITAB 统计软件为质量改善和概率应用提供准确和易用的工具。MINITAB 被许多世界一流的公司所采用,包括通用电器、福特汽车、通用汽车、3M、霍尼韦尔、LG、东芝、诺基亚、以及.
8+2-3=? 統計 吳函儒、李雅芳 吳秉蓉、王農景 - =
SPSS统计软件的使用方法基础 主讲人:宋振世 (闵行校区) 电 话:
第14章 預存程序 14-1 預存程序的基礎 14-2 建立與執行預存程序 14-3 預存程序的參數傳遞 14-4 預存程序的傳回值
認識健康體位: BMI:    維持18.5~24 腰圍: 男性:<90公分    女性:<80公分.
台南市永康區五王國小 體重過重學童衛教宣導
DOE & EXCEL, SPSS application
如何使用 Excel 與SPSS繪製 統計圖型
第一章.
程設一.
SAS 基础 SAS 功能及历史(略) INSIGHT,Analyst,Program 是统计分析的三种方法
統計學 授課教師:林志偉 Tel:5021.
Descriptive statistics
SAS  統計程序實作 CONTENTS By DR. Yang , Yi-Chiang /11/11.
第二章 SAS的描述统计功能 2.1 描述性统计的基本概念 2.2 在SAS中计算统计量 2.3 统计图形.
Dr. Baokun Li 经济实验教学中心 商务数据挖掘中心
第 3 章 敘述統計:數值方法.
第七章 SPSS的非参数检验.
實作輔導 日期: 3/11 09:10~16:00 地點:臺北市立大學 臺北市中正區愛國西路一號 (中正紀念堂站7號出口)
第 5 章 樣本資料的數值分布.
Chapter 2 第二章 Presenting Data in Tables and Charts 統計圖及表的應用
STATA 7 蘇國賢.
第一章 敘述統計學.
統計基本觀念 壹、資料 資料來源:實驗之量測結果,抽樣調查結果,公告資料。 一、資料類型
圖表製作 集中指標 0628 統計學.
Tel: 第11章 SPSS在时间序列预测中的应用 周早弘 旅游与城市管理学院
第 4 章 分散量數.
第四章 SPSS的基本统计分析.
Interval Estimation區間估計
SPSS-概述與資料處理 輔大統計資訊系 黃孝雲.
統計量數 集中趨勢量數 離散趨勢量數 相對位置量數 分配形態量數.
敍述統計學 許明宗.
第 3 章 敘述統計II:數值方法 Part A (3.1~3.2).
以每年參觀Lake Keepit的人數為例
Peking University SAS Club
SAS软件应用指南 第四章、第五章.
實作輔導 2 日期: 3/24(星期六) 09:10~16:00 地點:臺北市立大學 臺北市中正區愛國西路一號 (中正紀念堂站7號出口)
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
EXCEL+ORIGN+SPSS的描述统计
相關統計觀念復習 Review II.
Chapter 04 流程能力與績效分析.
Homework 1(1/2) 本頁表格為派密(Peavy)在07年球季各場次ERA的表現,(1)請依此數據完成下頁表格之統計值並說明之;(2)並與其他三名投手之統計值比較之。(請詳述計算過程) 場次 各場次ERA
Dr. C. Hsieh College of Informatics Kao yuan University
Chapter 5 z-Scores.
日期和函数 经济实验教学中心 商务数据挖掘中心.
SAS软件应用基础 SAS过程步.
統計學回顧 區國強.
Review of Statistics.
第7章 基本统计分析 2019/5/14.
第二章 次數分配表與統計圖 第一節 次數分配表的製作 第二節 統計圖的製作 第三節 次數分配的形狀和性質 第四節 電腦習作.
统计软件应用 4 主讲人 陶育纯 SPSS统计分析 统计软件应用 4 主讲人 陶育纯 教案.
统计软件应用 4 主讲人 陶育纯 SPSS统计分析 统计软件应用 4 主讲人 陶育纯 教案.
Logistic回归 Logistic regression 研究生《医学统计学》.
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士
SAS 統計程序實作 PROC GLM 變異數分析 (PROC ANOVA)
SAS 統計程序實作 PROC MEANS (一個母體)
Presentation transcript:

Dr. Baokun Li 经济实验教学中心 商务数据挖掘中心 描述统计的SAS方法 Dr. Baokun Li 经济实验教学中心 商务数据挖掘中心

建立和执行SAS程序的步骤 建立SAS程序 在程序编辑窗口,或者文本文件编辑器进行 2. 运行SAS 程序-点击工具条的图标   在程序编辑窗口,或者文本文件编辑器进行 2. 运行SAS 程序-点击工具条的图标 3. 观察日志文件-发现是否有错误和警告 如果有错误发生,返回到第一步,然后重复1-3 5. 如果没有错误了,看输出结果窗口 

(Descriptive Procedures) SAS 描述性统计程序步 (Descriptive Procedures) PROC PRINT PROC MEANS PROC UNIVARIATE PROC FREQ PROC PLOT PROC CHART PROC GPLOT PROC GCHART

程序步的用法 (Syntax for Procedures) PROC PROCNAME DATA=datasetname <可选项> ; 子句(substatements)/<可选项> ; WHERE 句子是所有程序步都允许的子句 (WHERE statement is a useful substatement available to all procedures.) PROC PRINT DATA=demo ; VAR marstat ; WHERE state = 'MN';

DATA demo; INFILE DATALINES; INPUT gender $ age marstat $ credits state $ ; if credits > 12 then fulltime = 'Y'; else fulltime = 'N'; if state = 'MN' then resid = 'Y'; else resid = 'N'; DATALINES; F 23 S 15 MN F 21 S 15 WI F 22 S 09 MN F 35 M 02 MN F 22 M 13 MN F 25 S 13 WI M 20 S 13 MN M 26 M 15 WI M 27 S 05 MN M 23 S 14 IA M 21 S 14 MN M 29 M 15 MN ; RUN;

* PROGRAM 3; DATA weight; INFILE ‘d:\...\tomhs.txt' ; INPUT ptid $ clinic $ sex $ height weight; bmi = (weight*703.0768)/(height*height); * bmi 的单位是kg/m2; RUN;

PROC PRINT DATA = weight (OBS=5) NOOBS; TITLE ‘Proc Print: TOMHS 数据的5条观测'; RUN; PROC MEANS DATA = weight; VAR height weight bmi; TITLE 'Proc Means Example 1'; PROC MEANS DATA = weight MEAN MEDIAN STD MAXDEC=2; TITLE ‘Proc Means Example 2 (指定选项)';

Proc Print: Five observations from the TOMHS Study patid clinic sex height weight bmi C03615 C 1 71.5 205.5 28.2620 B00979 B 1 69.5 247.3 35.9963 B00644 B 1 60.0 138.5 27.0489 D01348 D 1 71.5 205.5 28.2620 A01088 A 1 72.0 244.8 33.2008 Proc Means Example 1 The MEANS Procedure Variable N Mean Std Dev Minimum Maximum -------------------------------------------------------------------------- height 100 68.0750000 3.8536189 58.0000000 77.0000000 weight 100 191.7560000 34.5107254 128.5000000 279.3000000 bmi 100 28.9808397 3.9911476 21.4572336 37.5178852

Proc Means Example 2 (指定选项) The MEANS Procedure Variable Mean Median Std Dev -------------------------------------------------------- height 68.08 67.50 3.85 weight 191.76 192.65 34.51 bmi 28.98 28.02 3.99

FW=field width, 字段宽 PROC MEANS DATA = weight N MEAN STD MAXDEC=2 FW=8; CLASS clinic; TITLE ‘Proc Means Example 3 (使用 CLASS类别语句)'; RUN; N clinic Obs Variable N Mean Std Dev ---------------------------------------------------------- A 18 height 18 67.89 3.04 weight 18 192.73 37.68 bmi 18 29.24 4.50 B 29 height 29 67.76 4.76 weight 29 185.58 34.00 bmi 29 28.39 4.22 C 36 height 36 69.08 3.36 weight 36 202.91 33.74 bmi 36 29.76 3.62 D 17 height 17 66.68 3.61 weight 17 177.65 28.05 bmi 17 28.06 3.79 -----------------------------------------------------------

PROC UNIVARIATE DATA = weight PLOT ; ID ptid; VAR bmi; TITLE 'Proc Univariate Example 1'; RUN; * Note: PROC UNIVARIATE will give you much output ;

Proc Univariate Example 1 The UNIVARIATE Procedure Variable: bmi Moments N 100 Sum Weights 100 Mean 28.9808397 Sum Observations 2898.08397 Std Deviation 3.99114757 Variance 15.9292589 Skewness 0.27805446 Kurtosis -0.8987587 Uncorrected SS 85565.9037 Corrected SS 1576.99663 Coeff Variation 13.7716768 Std Error Mean 0.39911476 Basic Statistical Measures Location Variability Mean 28.98084 Std Deviation 3.99115 Median 28.01524 Variance 15.92926 Mode 28.26198 Range 16.06065 Interquartile Range 6.68654 Tests for Location: Mu0=0 Test -Statistic- -----p Value------ Student's t t 72.6128 Pr > |t| <.0001 Sign M 50 Pr >= |M| <.0001 Signed Rank S 2525 Pr >= |S| <.0001

Quantile Estimate 100% Max 37.5179 99% 37.4385 95% 35.8871 90% 34.3378 99% 37.4385 95% 35.8871 90% 34.3378 75% Q3 32.6299 50% Median 28.0152 25% Q1 25.9433 10% 24.1495 5% 22.9373 1% 21.8969 0% Min 21.4572 Extreme Observations ------------Lowest------------ ------------Highest----------- Value patid Obs Value patid Obs 21.4572 A00083 64 35.9963 B00979 2 22.3365 C04206 49 36.3726 B03077 67 22.4057 B00714 8 37.2037 A01166 9 22.6773 A00312 21 37.3592 C05323 92 22.8387 B00262 27 37.5179 B02059 25

----+----+----+----+ Stem Leaf # Boxplot 37 245 3 | 36 04 2 | 35 28 2 | 34 3357 4 | 33 000222344789 12 | 32 135677 6 +-----+ 31 3344588 7 | | 30 159 3 | | 29 26 2 | + | 28 00023335789 11 *-----* 27 000334466678 12 | | 26 02345566889 11 | | 25 223344789 9 +-----+ 24 1235688 7 | 23 0459 4 | 22 3478 4 | 21 5 1 | ----+----+----+----+ 75th Percentile Mean 25th Percentile

直线表明数据是正态分布 The UNIVARIATE Procedure Variable: bmi Normal Probability Plot 37.5+ * *+ * | *++ | *** | ***+ | ***** | **+++ | **++ | *++ 29.5+ +** | ++*** | +**** | +**** | **** | **** | ***+ | * ***++ 21.5+* ++ +----+----+----+----+----+----+----+----+----+----+ -2 -1 0 +1 +2 直线表明数据是正态分布

* High resolution graphs can also be produced. The following makes a histogram ; PROC UNIVARIATE DATA = weight; VAR bmi; HISTOGRAM bmi / NORMAL MIDPOINTS=20 to 40 by 2; INSET N = 'N' (5.0) MEAN = 'Mean' (5.1) STD = 'Sdev' (5.1) MIN = 'Min' (5.1) MAX = 'Max' (5.1)/ POS=lm HEADER='Summary Statistics'; LABEL bmi = 'Body Mass Index (kg/m2)'; TITLE 'Histogram of BMI'; RUN;

Using Comment Statements in SAS Two Purposes Documenting your program Temporary delete part of a program See Page 15-18 C & S

Examples of Comment Code PROC UNIVARIATE DATA = weight PLOT ; * Run proc univariate for variable BMI; *---------------------------------------------------------------------* High resolution graphs can also be produced. The following makes a pdf file containing a histogram with the best fit normal curve and summary statistics. Other types of files such as GIF *---------------------------------------------------------------------*; PROC UNIVARIATE DATA = weight PLOT ; * ID patid ; VAR bmi; PROC UNIVARIATE DATA = weight /*PLOT*/;

Temporarily Removing Code: Do not want to produce histogram but may want to run it at another time PROC UNIVARIATE DATA = weight; VAR bmi; /* HISTOGRAM bmi / NORMAL MIDPOINTS=20 to 40 by 2; INSET N = 'N' (5.0) MEAN = 'Mean' (5.1) STD = 'Sdev' (5.1) MIN = 'Min' (5.1) MAX = 'Max' (5.1)/ POS=lm HEADER='Summary Statistics'; */ LABEL bmi = 'Body Mass Index (kg/m2)'; TITLE 'Histogram of BMI'; RUN;