SAS Institute (Shanghai) Co., Ltd.

Slides:



Advertisements
Similar presentations
第二章 简单的 SQL 语句. 本章要点  创建一个简单的表  SQL 语句介绍  最简单的查询语句 select  带有限制条件的查询  查询结果的排序显示.
Advertisements

庄文忠 副教授 世新大学行政管理学系 2012/7/6 SPSS 之应用 ( 庄文忠副教授 ) 1 SPSS 的环境与基本操作.
Java 技术与应用 数据库应用 ( 第 14 章 ) 西安交大 卫颜俊 2008 年 12 月 电子信箱: QQ: 网站 : /java.
SPSS 軟體與統計應用 Ya-Yun Cheng, How-Ran Guo
第六 章数据库访问页 6.1 数据访问页视图 6.2 创建数据访问页 6.3 编辑数据访问页 6.4 查看数据访问页 退出.
Dr. Baokun Li 经济实验教学中心 商务数据挖掘中心
第2章 資料庫系統 2-1 資料庫環境的四大組成元件 2-2 ANSI/SPARC的三層資料庫系統架構
SPSS统计软件的使用方法基础 主讲人:宋振世 (闵行校区) 电 话:
第三章 建立数据集 SAS系统中建立数据集的途径主要有三种: ●使用传统的SAS数据步程序
資料庫 (Database) SQL Server 2008實作
文科计算机小公共课规划教材 Access 程序设计.
DOE & EXCEL, SPSS application
第三章 数据类型和数据操作 对海量数据进行有效的处理、存储和管理 3.1 数据类型 数据源 数据量 数据结构
Oracle数据库 Oracle 子程序.
An Introduction to Database System
SAS 基础 SAS 功能及历史(略) INSIGHT,Analyst,Program 是统计分析的三种方法
在PHP和MYSQL中实现完美的中文显示
基于R和pentaho的全套开源BI平台的实现
Lotus Domino R7 Designer
Hadoop I/O By ShiChaojie.
Dr. Baokun Li 经济实验教学中心 商务数据挖掘中心
第五讲 数据的分组、合并与转换.
統計套裝軟體 輔大統計資訊系 黃孝雲.
資料庫安全 (Database Security)
EndNote X5 Advance your Research and Publish Instantly
第4章(2) 空间数据库 —关系数据库 北京建筑工程学院 王文宇.
第八章 菜单设计 §8.1 Visual FoxPro 系统菜单 §8.2 为自己的程序添加菜单 §8.3 创建快捷菜单.
課程名稱:資料庫系統 授課老師:李春雄 博士
走进编程 程序的顺序结构(二).
第三章 项目设定.
2018/12/9 GDP系统 采购文控操作手册 GDP项目组.
第一单元 初识C程序与C程序开发平台搭建 ---观其大略
第十章 IDL访问数据库 10.1 数据库与数据库访问 1、数据库 数据库中数据的组织由低到高分为四级:字段、记录、表、数据库四种。
SPSS-概述與資料處理 輔大統計資訊系 黃孝雲.
第一章 SAS基础 1.1 初识SAS 1.2 初识INSIGHT模块 1.3 初识“分析家” 1.4 SAS编程初步.
第4章(1) 空间数据库 —数据库理论基础 北京建筑工程学院 王文宇.
第二章 Java语言基础.
数据挖掘工具性能比较.
Windows 7 的系统设置.
程序设计工具实习 Software Program Tool
SAS软件应用指南 第四章、第五章.
新PQDT论文全文库提交平台.
软件工程 第四章 软件设计 软件过程设计技术与工具.
CS, ZJU 4/18/2019 Chapter 7 数据库.
VB与Access数据库的连接.
姚金宇 MIT SCHEME 使用说明 姚金宇
<编程达人入门课程> 本节内容 内存的使用 视频提供:昆山爱达人信息技术有限公司 官网地址: 联系QQ: QQ交流群: ,
项目二:HTML语言基础.
本节内容 Win32 API中的宽字符 视频提供:昆山爱达人信息技术有限公司 官网地址: 联系QQ: QQ交流群 : 联系电话:
第4章 Excel电子表格制作软件 4.4 函数(一).
iSIGHT 基本培训 使用 Excel的栅栏问题
SAS软件应用基础 SAS过程步.
3.16 枚举算法及其程序实现 ——数组的作用.
Visual Basic程序设计 第13章 访问数据库
MyiLibrary® ‘Search & View’ 使用指南
Delphi 7.0开发示例.
数数据的基本操作 电子工业出版社.
符号 目录 页 绝对寻址和符号寻址… 符号寻址- 概述… 打开符号表 编辑:查找和替换…… 查看:过滤器 … 查看:排序…… 符号表:导出
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
Python 环境搭建 基于Anaconda和VSCode.
11 檢視表的建立 11-1 檢視表的基礎 11-2 建立檢視表 11-3 修改與刪除檢視表 11-4 編輯檢視表的內容.
第六章 Excel的应用 五、EXCEL的数据库功能 1、Excel的数据库及其结构 2、Excel下的数据排序 (1)Excel的字段名行
MyiLibrary® ‘Search & View’ 使用指南
回归分析实验课程 (实验三) 多项式回归和定性变量的处理.
基于列存储的RDF数据管理 朱敏
VB与Access数据库的连接.
第四章 UNIX文件系统.
第六讲 酒店客房管理系统(二) 教育部“十二五”职业教育国家规划教材
熟悉VC++开发环境.
Presentation transcript:

SAS Institute (Shanghai) Co., Ltd. 1

SAS系统 SAS系统是用于数据分析与决策支持的大 型集成式模块化软件包。 (其早期的名称为 Statistical Analysis System )

SAS系统是用于决策支持 的大型集成信息系统 数据访问 数据管理 数据呈现 数据分析

SAS 系统介绍 DATA The SAS System 数据访问 数据管理 分 布 式 计 算 环 境 Base SAS GRAPH, GIS, CALC, INSIGHT, SPECTRAVIEW, ASSIST Base SAS,STAT,ETS, OR,QC,IML,INSIGHT, NNA,LAB, SPECTRAVIEW AF EIS FSP 开 发 工 具 CONNECT SHARE IntrNET DATA Base SAS ACCESS MDDB Server ODBC Base SAS FSP SHARE CONNECT ASSIST Warehouse Admin. MDDB Server 数据分析 数据呈现

SAS系统的构成 SAS系统是一个可由几个到二、三十个工具模 块及面向行业的子系统组成的可伸缩系统。 其模块按功能大体有四类: 数据库及其管理 面向对象的4GL开发平台 各类堪称行业标准的分析工具 方便用户的外层技术(多平台支持,开 放环境,网络计算及分布处理)

SAS 系统软件由模块构成 数据库部分:BASE SAS, FSP, ACCESS,.. 分析核心:STAT, ETS, QC, OR, IML, . . . 开发呈现工具:AF, EIS, GRAPH, . . . 分布处理与数据仓库:CONNECT, WA, ..

提交信息(Information Delivery): SAS的核心业务 数据 进入 组织 利用 信息 知识 输出 管理 This is the process of going from data to information in order to make knowledgeable decisions about the next steps an organization needs to make. This is what we do at SAS Institute, over 5,000 employees…and everyone one of them is dedicated to a component of this process-taking raw data and turning it into useful information.

SAS系统简介 要 求 进入SAS系统 发常用命令,切换窗口 进Assist和Desktop窗口

SAS系统简介 §1 SAS 提供的基本运行环境 启动SAS:在Windows桌面系统下双击 SAS图标 或运行SAS系统目录下(例C:\SAS)的可 执行程序sas.exe 常用的是交互运行方式。也可用提交批作业 方式运行的

SAS系统简介 §1 SAS 提供的基本运行环境 显示管理系统 下拉菜单(弹出菜单) 命令框、工具栏 三个基本窗口 PROGRAM EDITOR 窗口 LOG 窗口,OUTPUT 窗口 工作界面介绍 2

SAS系统简介 §1 SAS 提供的基本运行环境--三个基本窗口 是一个基本的敞口,缺省地打开 依次记录程序输出的结果 有结果输出时自动转到前台 是一个基本的窗口,缺省地打开 依次记录SAS进程中各程序运行的信息 可用命令清空

SAS系统简介 §1 SAS 提供的基本运行环境 用SAS/ASSIST 用SAS桌面系统

SAS系统简介 §1 SAS 提供的基本运行环境 在交互式操作中用命令指挥显示管理系统、切换窗口和完成各种特定的功能 发布命令有四种方式: 在命令框直接键入命令; 使用下拉菜单; 使用工具栏。 按功能键; 发命令

SAS系统简介 §1 SAS 提供的基本运行环境 常用的其它窗口: KEYS 查看及改变功能键的设置 LIBNAME 查看已存在的SAS数据库 DIR 查看某个SAS数据库的内容 VAR 查看SAS数据集的有关信息 OPTIONS 查看及改变SAS的系统设置

SAS系统简介 §1 SAS 提供的基本运行环境 进入SAS/ASSIST 使用工具栏图标 发命令ASSIST 下拉菜单选 Globals ASSIST 进入SAS桌面系统 发命令DESKTOP 下拉菜单选 Globals  Desktop 进菜单系统

SAS系统简介 § 2 运行一个简单的SAS程序 运行一个简单的 SAS 程序: 在 PROGRAM EDITOR 窗口中键入程序: 提交程序(SUBMIT) 查看 LOG 窗口的信息 调出提交的程序(RECALL)并修改,再次提交 在 OUTPUT 窗口查看运行结果 存储程序 P005

SAS系统对数据的管理 要 求 设定、浏览SAS数据库 打开SAS数据集及其变量窗口

SAS系统对数据的管理 SAS对数据的分析与呈现都是面对SAS数据集 进行的 SAS数据集是一种SAS文件 SAS文件是由SAS系统创建和管理的有特殊结 构的文件。包括 SAS数据集和SAS目录册 (CATALOG)等

SAS系统对数据的管理 数据直接输入 流行的数据库 其它文件格式 SAS数据集 SAS应用程序

SAS系统对数据的管理 §1 SAS 数据库 SAS数据集存储在SAS数据库中 SAS数据库还存储其它SAS专用文件 SAS数据库文件用两级命名方式定名: libname.SAS-filename (库标记.文件名) SAS数据库 SAS数据集

SAS系统对数据的管理 §1 SAS 数据库 SAS数据库有永久库和临时库两种 临时库:名为WORK,系统自动指定 永久库:系统自动指定名为SASUSER, (SASHELP等). 其它可由用户指定

SAS系统对数据的管理 §1 SAS 数据库 用工具栏中的图标进入库管理对话窗 或键入命令 Dlglib 或 Global  Access  Display Liberary 可进入库管理窗口浏览库内容和库文件 或用LIBNAME命令进入Libname窗口 用DIR 命令进入Dir窗口 用VAR 命令进入Var窗口 操作:看库

SAS系统对数据的管理 §1 SAS 数据库 不同的主操作系统下SAS数据库文件以不同 方式与主操作系统下的文件组织相联系 在Windows下每个SAS数据库置于某个子目 录之中 例:SASUSER: C:\SAS\SASUSER WORK: C:\SAS\SASWORK COURSE: C:\USERS\ZDW

SAS系统对数据的管理 §1 SAS 数据库 设定 用工具栏中的图标进入库管理对话窗, 按下New Library按键 使用LIBNAME语句可以指定SAS库标:LIBNAME 库名 SAS数据库挘 在Windows环境下: LIBNAME 库名 目录名挘 LIBNAME course ‘c:\course’; 连库 Libname 库名 ('目录1' '目录2')

SAS系统对数据的管理 §2 SAS 数据集 两种类型的数据对象: SAS数据集(Data sets): 包含描述部分和数据部分 SAS数据视窗(Data View): 只含描述部分 (变量名,属性,长度,标题 格式,创建与修改日期) 4

SAS系统对数据的管理 §2 SAS 数据集: 描述部分

SAS系统对数据的管理 §2 SAS 数据集: 描述部分 Global  Access  Display Liberary . . . Desktop  SAS Explore  File  Pop menu  Contents Ass  D.Manag.  Utilities  Contents..  B & E  Dst Attr. Proc contents data=SAS数据集 <position>; run;

SAS系统对数据的管理 §2 SAS 数据集: 数据部分 变 量(字段、列) 记录 或行 缺失值(Missing Value)。 字符型变量的缺失值用空格符表示 数值型变量的缺失值用句号“ . ”表示

SAS系统对数据的管理 §2 SAS 数据集看数据集 用工具栏中的图标进入库管理对话窗  选中数据集  在弹出菜单选 Open table view 发命令:VT(或FSV) 数据集名 提交程序: proc print data=数据集名; run;

浏览和编辑SAS数据集 要 求 使用ViewTable浏览、编辑和新建SAS数据集 使用Proc Print输出SAS 数据集 要 求 使用ViewTable浏览、编辑和新建SAS数据集 使用Proc Print输出SAS 数据集 在SAS系统中浏览和编辑SAS数据集必须先 设定SAS数据库,将要浏览和编辑的数据集 存放在已设定的SAS数据库中

浏览和编辑SAS数据集 §1 使用Viewtable 浏览与编辑 Table View 以矩阵表格形式显示数据,一次可显示多条记录 Form View 一次只显示一条记录

浏览和编辑SAS数据集 §1 使用Viewtable 浏览与编辑 键入命令:VT 数据集名

浏览和编辑SAS数据集 §1 使用Viewtable 浏览与编辑 View  Form view Table view View  Column Label Column Name Edit  Edit Mode Browse Mode Edit  Row Level Edit Table Level Edit 列:(Data  ) 改边宽度, 移动次序 Hide Sort Hold Column Attr. 颜色 行: Edit  Find(例D1F) Data  Where 加行

浏览和编辑SAS数据集 §1 使用Viewtable 浏览与编辑 除了Viewtable窗口外, FSV等也提供了字符型界面的数据集的浏览和编辑的窗口,它打开数据集的速度更快。 Insight和Analyst Application也提供了对数据集浏览和编辑的窗口,他们在生成新变量方面有更强的功能

浏览和编辑SAS数据集 §1 使用Viewtable 浏览与编辑 逐条浏览:命令:FSE 数据集名 PROC FSEDIT DATA=SAS-data-set; RUN; 成批浏览:命令: FSV 数据集名 PROC FSVIEW DATA=SAS-data-set; RUN; 操作:看生成的数据集和sasuser.class

浏览和编辑SAS数据集 §2 用Viewtable新建数据集 FSEDIT FSVIEW 编程:用DATA步 数据存于纸上 需直接键入 数据存于文本文件 用Import菜单 数据存于流行 数据库文件中 用SAS/ACCESS

浏览和编辑SAS数据集 §2 用Viewtable新建数据集 设定变量属性 对格式和其它属性无特殊要求的也可先输入数据,而后设定各个变量的属性。 命令:VT。 选中变量名在弹出菜单选Column Attributes 先输入数据举例.另法:File=>Add Item=>Table

浏览和编辑SAS数据集 §2 用Viewtable新建数据集 设定变量属性 数据集变量的属性描述: 变量名(Name):字母或下划线开始且不超过 8个字符或数字构成 类型(Type):数值型、字符型 长度(Length):缺省8字节(  200) 标题名(Label): 缺省40字节 输入格式(Informat):$输入格式名w.d 输出格式(Format): $输出格式名w.d 必须 可选 6

浏览和编辑SAS数据集 §2 用Viewtable新建数据集 设定变量属性 在数据集的一条记录的某个变量无数据时,称为 缺失值(Missing Value)。 字符型变量的缺失值用空格符表示 数值型变量的缺失值用句号“ . ”表示 NAME SEX POSITION AGE SALARY Alex M A 35 1500 Linda F 28 1400 Simon M C 45  6

浏览和编辑SAS数据集 §2 用Viewtable新建数据集 设定变量属性 输入、输出格式例: 输入格式 输入数据 12234.1234 12,234.1234 $12,234.1234 8.2 comma8.2 dollar8.2 实际存储 数据值 12234.12 输出格式 输出数据 12234.12 12,234.12 $12,234.12 8.2 comma8.2 dollar8.2

浏览和编辑SAS数据集 §2 用Viewtable新建数据集 设定变量属性 日期输入、输出格式例: 1960,1,10 1960,1,21 1960,2,131 1961,1,1366 输入格式 输入数据 20OCT97 20/10/97 1997/10/20 DATE7. DDMMYY8. yymmdd10. 实际存储 数据值 13807 输出格式 date9. mmddyy6. yymmdd8. 输出数据 20OCT1997 102097 97-10-20 转换:data _null_; x=put(today(), date7.);put x;run; datetry

浏览和编辑SAS数据集 §2 用Viewtable新建数据集 设定变量属性 几种常用的输入、输出格式: w.d $w. COMMAw.d DOLLARw.d DATEw. MMDDYYw. 标准的数字型格式 标准的字符型格式 数字中嵌入逗号 数字中嵌入逗号,前加$ 日期格式

浏览和编辑SAS数据集 §2 用Viewtable新建数据集 设定变量属性 利用HELP查找SAS系统提供的输入、出格式 Help下拉菜单 SAS System 目录: SAS Language 索 引: SAS Informats and Formats -- Contents SAS Formats and Informats 从函数名找 从分类功能找

SAS编程基本概念 用户提交的 SAS 程序由许多程序步构成。 数据步常用于创建数据集 过程步常用于处理数据集(生成 原始 数据 过程步 Proc Step 数据步 Data Step 报告 SAS表 SAS表 过程步常用于处理数据集(生成 报表、图形和实现数据分析功能)

SAS编程基本概念 SAS的程序由两种程序步(Step)构成: 数据步(DATA STEP): 以(DATA)语句开始,创建和处理SAS 数据集 过程步(PROC STEP): 以(PROC)语句开始,用于处理SAS数据

SAS编程基本概念 SAS的每个程序步都由语句构成。 每个语句常以开始的关键词称呼,用分号表示语句的结束。 SAS语句书写的格式较为任意 语句可以在任一列开始和结束 词间可任意加入空格和换行 一个语句可跨多行,多个语句可写在一行 良好的书写格式便于程序的阅读 看例e029, e029_2

浏览和编辑SAS数据集 §3 打印数据集 基于数据集的报表从其内容来看大体有两类: 一类是提供数据集的详细数据为主,在SAS 中是采用Report窗口或用过程print或report 另一类是只含各种分类的汇总信息,在SAS 中是采用过程 tabulate 或与此联系的菜单窗口

浏览和编辑SAS数据集 §3 打印数据集 PROC PRINT DATA=SAS-data-set; RUN; 编程: 20

浏览和编辑SAS数据集 §3 打印数据集 PROC PRINT DATA=SAS-data-set <NOOBS>; ID variable; VAR variables; WHERE where-expression; SUM variables; BY by-variables; PAGEBY by- variables; RUN;

浏览和编辑SAS数据集 §3 打印数据集 p70 最简打印并生成数 据lonpar p071 noobs p072 Var p074_1 where p074_2 sum p075 by (sort) p076 id p077 page by p79 title,footnote p80 改title p81_1 加label p81_2 split p84 format p86 用定义format (也可用class为例) p88 options

浏览和编辑SAS数据集 §3 打印数据集 Format的使用 若数据集形成时已为变量规定format,则在打印输出时自动运用这一format。 在打印程序中使用format语句,可为变量临时设定使用的format。 format语句的形式为 FORMAT variables format ; 例 format date yymmdd10.;

浏览和编辑SAS数据集 §3 打印数据集 Format的使用 FORMAT variables format ; 定义用户格式: PROC FORMAT; VALUE format-name range1=label range2=label . . . . . ;

浏览和编辑SAS数据集 §3 打印数据集 Label的使用 LABEL variable1=label variable2=label . . . . . . . . . .; Print 选项 : SPLIT=符号

浏览和编辑SAS数据集 §3 打印数据集 标题、脚注和选项 标题、脚注和选项: TITLEn text; FOOTNOTEn text; OPTIONS options;

浏览和编辑SAS数据集 §3 打印数据集 系统相关的选项 与PRINT有关的一些系统选项 CENTER | NOCENTER DATE | NODATE NUMBER | NONUMBER LINESIZE=width PAGESIZE=n PAGENO=n 定义方法 OPTIONS 语句 OPTIONS 窗口

浏览和编辑SAS数据集 §3 打印数据集 过程语句的选项 PROC PRINT 选项; PROC PRINT 的一些选项: HEADING=v|h LABEL SPLIT=符号 WIDTH=Full|Min|U

浏览和编辑SAS数据集 §3 打印数据集 Printto的使用 将打印结果和运行信息直接记入文件 proc printto print='文件名' log='文件名' new; 过程步 proc printto; filename fileref '文件名'; prtto

第四章 生成SAS数据集 要 求 会用数据步输入简单的数据集 会使用Import和Access窗口 菜单系统

第四章 生成SAS数据集 建立SAS数据集的各种途径 用VIEWTABLE 数据存于纸上 FSEDIT FSVIEW 需直接键入 编程:用DATA步 §3.3 数据存于纸上 需直接键入 数据存于文本文件 用Import菜单 数据存于流行 数据库文件中 用SAS/ACCESS

第四章 生成SAS数据集 §1 使用数据步新建数据集 SAS的程序由两种程序步(Step)构成: 数据步(DATA STEP): 以(DATA)语句开始,创建和处理SAS 数据集 过程步(PROC STEP): 以(PROC)语句开始,用于处理SAS数据

第四章 生成SAS数据集 §1 使用数据步新建数据集 Data步程序 看Imptdt1-Imptdt4 不同格式文本本件

第四章 生成SAS数据集 §1 使用数据步新建数据集 自文本数据文件生成 SAS 数据集 的DATA步的一般形式: DATA SAS数据集名; 变量属性设定语句; INFILE 文件名 FIRSTOBS=n1 OBS=n2; INPUT 语句; 其它语句; RUN;

第四章 生成SAS数据集 §1 使用数据步新建数据集 DATA步中设定变量属性的语句: LENGTH 变量名 <$>长度 . . . ; INFORMAT 变量名 输入格式 . . .; FORMAT 变量名 输出格式 . . .; LABEL 变量名= 字符串输入格式 . . .; Length还决定了变量在数据集中的次序

第四章 生成SAS数据集 §1 使用数据步新建数据集 INPUT 语句 INPUT <设定1><. . .设定n > <@|@@>; 设定的格式: List: 变量名 <$><:输入格式> Colunm: 变量名 <$>始列-终列 Formatted: 指针 变量名 输入格式 指针:@n|+n Named: 变量名= <$>始列-终列 输入换行控制:@:不换行等待下一个Input语句 @@: 形成输出记录时输入也不换行

第四章 生成SAS数据集 §1 使用数据步新建数据集 INPUT <设定1><. . .设定n > <@|@@>; 在数据步输入中,一个input 语句就从输入文件中读入新的一行按要求写入SAS记录。在数据步一轮结束或有output语句时写一行SAS记录。若输入行中字段数少于input 语句中的变量数就输入下一行记录接着写。输入语句结束时输入行剩余的内容也就不用了。所以在输入语句中 @:保留输入行等待数据步中下一个input语句使用。但在数据步自动形成输出记录时输入行剩余的内容也清除了 @@: 除@的功能外在形成输出记录时输入也不换输入行

第四章 生成SAS数据集 §1 使用数据步新建数据集 INPUT 语句- List格式(自由格式) INPUT 变量名 <$><:输入格式>       变量名 <$><:输入格式>. . . ; 源文件中字段件至少有一个空格或特定字符分隔 字段只能按序输入 缺失值必须用句点表示 字符变量的值不能含有空格,长度一般不超过8 P

第四章 生成SAS数据集 §1 使用数据步新建数据集 p33_1 list(直接) p33_2 文件(Imptdt1) p33_3 部分观测 p33_4 list+informat p33_5 format, informat length 次序(直接) Infile语句的选项delimiter=‘*’ dsd missover lrecl= Imptdt1.dat分开、对齐 p033_2 Imptdt2.dat不分开、对齐 p034 Imptdt3.dat分开、不对齐 Imptdt4.dat对齐、有空格 p036 Time.dat变量名逗号分开 Imptdt5.dat有空格逗号分开

第四章 生成SAS数据集 §1 使用数据步新建数据集 INPUT 语句- Column格式 INPUT 变量名 <$>始列-终列     变量名 <$>始列-终列. . . ; 源文件中各变量所在位置必须是规则的 每个变量按指定指定的始列终列读入 字符变量的长度不受缺省值的限制(但<=200) 变量值可含空格,变量输入次序可以是任意的 任何字段或起部分可重复读入 p034 无空

第四章 生成SAS数据集 §1 使用数据步新建数据集 INPUT 语句- Formatted格式 INPUT 指针 变量名 输入格式    指针 变量名 输入格式. . . ; 指针:@n|+n 源文件中各变量所在位置必须是规则的 每个变量按输入格式读入指定的长度 可用指针控制下一个变量读入的始点 变量值可含空格,变量输入次序可以是任意的 任何字段或起部分可重复读入 P

第四章 生成SAS数据集 §1 使用数据步新建数据集 p036 formatted(文件Imptdt2) p036_1 直接 p036_2 跳空,改序 p036_3 format, length 次序 p036_4 含空格变量值(Imptdt4) p036_5 混用 Imptdt1.dat分开、对齐 Imptdt2.dat不分开、对齐 Imptdt3.dat分开、不对齐 Imptdt4.dat对齐、有空格

第四章 生成SAS数据集 §1 使用数据步新建数据集 自文本数据文件生成 直接输入数据 DATA SAS-data-set ; 变量属性设定语句; INFILE filename <FIRSTOBS=n1 OBS=n2>; INPUT 语句; 其它语句; RUN; DATA SAS-data-set ; 变量属性设定语句; INPUT 语句; 其它语句; CARDS; 数据行; RUN; p036_1直接

第四章 生成SAS数据集 §2 使用Import菜单由文本文件读入 SAS的Import/Export菜单界面提供一个使用鼠标器的图形界面 Import: 读入外部文件并写为SAS数据集 Export: 读入SAS数据集并写为外部文件格式存放 在Windows操作系统中,外部文件指:文本文件,dbf,xls, wk1, wk3 等格式的文件

第四章 生成SAS数据集 §2 使用Import菜单由文本文件读入 由下拉菜单 File  Import(Export) 按提示逐步转换外部文件为SAS 数据集(或将SAS数据集转换为外部文件) 对一些用户规定格式的文件提供EFI (External File Interface 外部文件界面)

第四章 生成SAS数据集 §2 使用Import菜单由文本文件读入 读(写)其它格式表的地址与名 要转换的行与列 SAS数据集的属性

第四章 生成SAS数据集 §2 使用Import菜单由文本文件读入 Imptdt1.dat分开、对齐 Imptdt2.dat不分开、对齐 Imptdt3.dat分开、不对齐 Imptdt4.dat对齐、有空格 Time.dat变量名逗号分开 Imptdt5.dat有空格逗号分开 文本文件: dt1:list: auto,manual, column dt2:column dt3:list 编程 dt4:column Time:变量名,逗号分开 dt5:变量名,逗号,自动 Payroll.sepseptpay list方式, 逗号分开 idnum,salary93-salary96

第四章 生成SAS数据集 §2 使用Import菜单由文本文件读入 Excel文件: Modflts.xls航班信息: 第一行为变量名 Sasxls.xls: 无变量名,改个别姓名为中文

第四章 生成SAS数据集 §3 使用Access 访问其它数据库文件 SAS/ACCESS 支持的软件产品有: DB2, ORACLE, SYBASE, INFORMIX, SQL Server, INGRES, dBASE, EXCEL, ODBC, Lotus1-2-3 等。

第四章 生成SAS数据集 §3 使用Access 访问其它数据库文件 读(写)其它格式表的地址与名称 要转换的行与列 SAS数据集的属性

第四章 生成SAS数据集 §3 使用Access 访问其它数据库文件 外部数据文件 ACCESS描述器 *.sa2 View描述器 *.sv2 SAS数据集 *.sd2

第四章 生成SAS数据集 §3 使用Access 访问其它数据库文件 使用ACCESS 访问其它格式的数据文件, 可以通过Access窗口交互式地完成, 也可以由编程实现 进Access窗: 下拉菜单: Global  Access  Access database files 发命令:Access All.dbf, sas.dbf, sasxlx.xls 27

第四章 生成SAS数据集 §3 使用Access 访问其它数据库文件 在Access窗建Access描述器 File New… 填描述器所在库,名称 填外部文件格式 填外部文件地址,名称 选变量、更名及格式 File  End 在Access窗看 .access 在Access窗建View 在描述器前键入CV 选变量(Local  Select All) (选子集) F3 在Access窗看 .view及数 据表

第四章 生成SAS数据集 §3 使用Access 访问其它数据库文件 July.dbfjuly1.sa2 julyall.sv2 local  subset: julylax where hub=‘lax’ 并生成数据集 选变量:julypart 建议用all.dbf为练习

第四章 生成SAS数据集 §3 使用Access 访问其它数据库文件 生成存取描述文件: PROC ACCESS DBMS=DBF|XLS; CREATE 库名.文件名.ACCESS; PATH=外部数据文件路径; RUN; p128_1 建Access

第四章 生成SAS数据集 §3 使用Access 访问其它数据库文件 由存取描述文件生成VIEW: PROC ACCESS DBMS=DBF|XLS ACCDES=描述文件名; CREATE 库名.文件名.VIEW; SELECT ALL|变量名列; RUN; p128_2 建View

第四章 生成SAS数据集 §3 使用Access 访问其它数据库文件 生成描述文件与VIEW一步完成: PROC ACCESS DBMS=DBF|XLS; CREATE 库名.文件名.ACCESS; PATH=外部数据文件路径; CREATE 库名.文件名.VIEW; SELECT ALL|变量名列; RUN; p129 合一

第四章 生成SAS数据集 §3 使用Access 访问其它数据库文件 生成其它格式的数据文件: PROC DBLOAD DBMS=DBF|XLS DATA=SAS数据集名; PATH 外部数据文件路径; LOAD; RUN;

第五章 加工SAS数据集 要 求 会使用数据步对数据集作简单的加工(增删改变量等) 会使用SQL Query窗查询加工数据

第五章 加工SAS数据集 加工SAS数据集 增改删数据集中的变量和记录 菜单: SQL Query窗 编程: 数据步 在Input语句后加入各种语句 对已有的SAS数据集加工: 在Set语句后加入各种语句

第五章 加工SAS数据集 §2 使用SQL Query窗 进入SQL Query窗: 发命令:Query 下拉菜单:Globals  Access  Query 进窗后,选中要看或加工的数据集 OK

第五章 加工SAS数据集 §2 使用SQL Query窗 选变量(由左窗移至右窗): Actions  Run Query  Run Immediate 加label, 改format, 变量排次序 建表(建数据集): File  Create Table…(Create View…) 其他: Show query, Save query,...

第五章 加工SAS数据集 §2 使用SQL Query窗 选观测: Locals  Where Conditions for Subset 观测排序: Locals  Order by… 建立新的变量: 进入变量选择窗后按Build a column 键

第五章 加工SAS数据集 §1 用数据步加工 加工SAS数据集 增改删数据集中的变量和记录 菜单: SQL Query窗 编程: 数据步 在Input语句后加入各种语句 对已有的SAS数据集加工: 在Set语句后加入各种语句

第五章 加工SAS数据集 §1 用数据步加工 增改删数据集中的记录或变量 DATA new; DATA new; . . . .; 或在INPUT语句后 或用SET语句并 加入其它SAS语句: 加入其它SAS语句 DATA new; . . . .; INPUT . . .; 其它 SAS 语句; RUN; DATA new; SET old; 其它 SAS 语句; RUN;

第五章 加工SAS数据集 §1 用数据步加工 选择变量 在DATA 语句中用选项DROP= 和 KEEP= 在SET 语句中用选项DROP= 和 KEEP= 在DATA步中加入DROP语句和 KEEP语句 操作, p047

第五章 加工SAS数据集 §1 用数据步加工--加减变量 选择观测 保留 IF expression; 剔除 IF expression THEN DELETE; 操作:class, if 年龄,性别

第五章 加工SAS数据集 §1 用数据步加工--选择观测 在DATA 语句中用选项WHERE= 在SET 语句中用选项WHERE= 在SET 语句中用选项FIRSTOBS= 和/或OBS= 操作

第五章 加工SAS数据集 §1 用数据步加工--记录排序 用PROC SORT语句对SAS数据集排序 PROC SORT DATA=SAS数据集 OUT=SAS数据集; BY descending 排序变量1. . . . ; RUN; p061或用class

第五章 加工SAS数据集 §2 用数据步加工 DATA步中常用的语句: 设定变量属性的语句 赋值语句 条件语句 循环语句 转移语句 OUTPUT语句与PUT语句

第五章 加工SAS数据集 §2 用数据步加工--赋值语句 赋值语句的一般形式 var = expression var 新建或修改的变量名 expression 由变量、SAS函数和四则运算 (+, -,*,/,**)构成的表示式 赋值语句将表示式的值赋给变量 操作:class, W/H h inch -> cm

第五章 加工SAS数据集 §2 用数据步加工-- SAS函数 调用形式: 函数名(变元<, 变元,. . .> ) 函数名(OF 变量名列) 其中变元可以是常数、变量、函数或表示式 例:sqrt(x), probnorm(x), tinv(x,df) sum(of x1, x10-x20, x25) fct132 取整,fct134 平均,求和

第五章 加工SAS数据集 §2 用数据步加工-- SAS函数 利用HELP查找SAS系统提供的各种函数 Help下拉菜单 SAS System 目录: SAS Language 索引: SAS Function -- Contents SAS Functions 从函数名找 从分类功能找

第五章 加工SAS数据集 §2 用数据步加工-- SAS函数

第五章 加工SAS数据集 §2 用数据步加工--SAS函数 测试函数功能的一个简单的程序: data _null_; y=sqrt(3); put y= ; run;

第五章 加工SAS数据集 §2 用数据步加工-- SAS函数 直接作为数字型常数: ddMMMyy D 一些操作日期的函数: DATE(), TODAY(), DATETIME(), TIME(), YEAR(SAS-date), QTR(SAS-date), MONTH(SAS-date) DAY(SAS-date), HOUR(datetime|time), MINUTE(. . .), MDY(month,day,year), HMS(hour,minute,second), DHMS(date,hour,minute,second) p050 日期函数

第五章 加工SAS数据集 §2 用数据步加工--条件语句 IF 条件表达式 THEN 可执行语句; ELSE 可执行语句 ; IF expression THEN DO; statements ; . . . END; ELSE 比较操作符: <, LT, >, GT, =EQ, LE, GE, NE, IN 逻辑操作符: & AND, - OR, ^ NOT. 书上例,p41开始

第五章 加工SAS数据集 §2 用数据步加工--例 p41 total=..+ p42 total=sum(.) 可将infile input 改为set p44_1 If ... then p44_2 uppercase(.) p45 do. . . end p46 length p47 drop p48 if p49 if . . . then delete p50 date 格式 p51 date 比较