宏软 SAS 学习版 1.0
(Statistical Analysis System)
SAS 系统
—— 数据处理和统计领域的国际标准软件
—— 世界领先的数据分析和信息系统
引 言
? SAS 被评为, 最佳数据仓库 /商业智能解决方
案供应商,
在 DM Review杂志 2000年度, 最佳数据仓库 /商业智
能解决方案供应商, 选举当中,SAS领先于 Microsoft,
IBM和 Oracle等著名厂家,名列榜首。这是 SAS 连续两年
荣获该项荣誉。
引 言
SAS 系统的发展:
统计分析软件 → 大型集成应用软件系统
具有完备的数据访问、管理、分析、呈现及应用开
发等功能
SAS 系统已经被成功应用于 120多个国家和地区的
31,000多个机构中,直接用户超过 3,500,000人。
引 言
安装与启动
( 1)运行光盘中“安装学习版”目录下的 SETUP.EXE;
( 2)运行密码更新程序,UPDATE.EXE;
( 3)安装完成后,运行安装目录下的 SAS.EXE,或运行桌面
上的快捷方式。
注意,在安装过程中,选择的安装路径不能用长文件名和包含
中文字符。
数据集和数据库
数据集 (data set):存放数据,该文件的后缀名为 sd2;
数据库 (library):存放数据集 (相当与 windows下的文件
夹 ),用 库标记 表示文件夹。
SAS系统中数据集文件的表达方式:库标记,数据集
名(如 sasuser.build)
数据集的类型,
● 临时数据集,在 SAS程序中产生的不带库标记(或库标记
为 work) 的数据集,一般存放在 saswork文件夹内,退出 SAS
系统后,该文件被自动删除。
● 永久数据集,退出 SAS也存在于磁盘上的数据集。
数据集和数据库
● 通过“数据采集”按钮创建;
● 在“交互数据分析”中新建数据集;
● 在“分析员应用”中新建数据集;
● 运用编程的方法创建。
数据集的创建
一、通过, 数据采集, 创建数据集,
数据采集 ———— 创建、查看数据集
———— 进入数据编辑窗口
数据集的创建
数据集框架,
列的顶端 (A,B,C,…) 为变量 (variable)
的名称;行的最左侧 (1,2,3,…) 为观测
(observation) 的次序 ; 某行某列的交界处为
某观测的某变量的测量值。
数据集的创建
变量名 (name),只能用英文字符或数字表示,
最大长度为 8个字符,双击变量名可修改。
变量标签 (label),表示变量的含义,可输入多
个字符,也可以输入中文。
数据集的创建
变量类型
· 字符型 (character),一般表示计数资料;
· 数值型 (numeric),一般表示计量资料,也可
表示等级资料。
数据集的创建
变量长度 (length)
· 字符型变量, 1-200个字符
· 数值型变量, 1-32位
数据集的创建
输入和输出格式
· 输入格式 (informat),是 SAS系统用于读入数
据值到某个变量中的一个指令;
· 输出格式 (format),是 SAS系统用于输出数据
值的一个指令。
数据集的创建
二、运行“交互数据分析”新建数据集,
交互数据分析 ——SAS/insight,Open对话框
——New——进入数据集编辑窗口,新数据集
文件名为 work.a
数据集的创建
点击窗口最左上角的三角形,”,选择
,new
variable”,确定需建立的变量的个数。默认的
变量名为 A,B,C…… 。 可双击变量名改变变
量名及其属性。
▼
数据集的创建
测量水平( measurement level)
● 区间型( interval)
● 列名型或名义型( nominal)
区间型变量必须是数值型变量,可以对其
观测值进行运算,计算各种统计量;名义型变
量可以是数值型,也可以是字符型,通常起分
类的作用。
数据集的创建
三、运行“分析员应用”新建数据集,
点击分析员应用,出现左右两个窗口,左
侧为分析结果的目录树,右侧为空白数据表,
双击变量名可改变变量名,在数据表中直接可
直接输入数据。
数据集的创建
四、运用编程的方法创建数据集
例,data sasuser.a;
input x1 x2 $@@;
cards;
12 m 13 m 14 f 12 f 15 m 17 f;
run;
数据集的创建
文本文件快速转换
主要功能:将文本文件转换为 SAS数据集
数据采集 ——文本文件快速转换 ——文本数据
转入 ---定义外部数据源对话框(“数据说明”
和
“存为 SAS数据表”两个对话框)
“数据说明”对话框的内容:
1、输入文本数据源:指定文本文件的位置。
2、第一行作为字段名:如选择,则文本文件中的第一行的内容被定
义为数据集的变量名,如不选择,则数据集中的变量名自动定义为
X1,X2,X3等。
3、选择需转换的列:输入需转换的列数。
4、从第几行取值:输入数值
5、估计字符字段最长位数:输入数值
6、字段间所用间隔符:空格( blank),制表符( tab),逗号、
分号、竖线、斜线等。
文本文件快速转换
“存为 SAS数据表”对话框的内容,
SAS数据库:选择已定义的数据库的名字
数据表:输入数据表(集)的名称
上述内容选择完毕后,点击“下一页”进
入“文本数据转换 —数据预览”
文本文件快速转换
在数据预览对话框中,可以看到所有数据
的格式都是字符型,点击“修改属性”进入修
改数据属性对话框,可改变变量名、变量标签
和变量的类型。修改后点击“确定”回到“数
据预览”对话框,再点击“确定”就将文本文
件转换位 SAS数据集。
文本文件快速转换
主要功能:
1、列输入格式的文本文件转换成 SAS数据集。
2,SAS数据集转换成其他格式的文件,如文本
格式( *.dat) 或 RTF格式。
文本文件转换
1、将列输入格式的文本文件转换为 SAS数据集
数据采集 —— 文本文件转换 ——,Import,
Column”对话框 ——, File”——“Import”
——,From External file”下面的对话框中输入
选择的文本文件。
文本文件转换
,To (SAS file)”:
Library:选择数据库;
Member:输入数据集的名称;
Data file 或 Data view:任选其中一个。
Use template:选择模板。
选择完毕后,按,ok”确定。
文本文件转换
Field Name:输入变量名
Descriptive label:变量标签
Begin:起始列号 End:结束列号
Length:变量长度 (自动判别 )
Character / Numeric:变量类型 (字符 /数值)
Informat /format:输入和输出格式(自动判别)
文本文件转换
每个变量的各项选项输入完毕后,按
,Add”将该变量填加到数据集中,当所有变量
输入完毕后,需保存数据集文件,file—save。
文本文件转换
2、将 SAS数据集转换为其他格式的文件
数据采集 —— 文本文件转换 ——,Import,
Column”对话框 ——, File”——“Export”
——,From (SAS file)”对话框中输入选择的
SAS数据集。,To External file”对话框中输入
外
部文件的文件名。,ok”确定。
文本文件转换
缺省状态为将所有变量全部输出,也可根
据自己的需要,选择需输出的变量:点击不
输出的变量,再点击,Exclude”,则去除该
变量。如再需要,再点击该变量,则
,Exclude”变成,Include”,点击后重新将
该变量输出。
文本文件转换
SAS学习版可直接将 Excel中的数据转换为
SAS数据集,具体操作:
数据采集 ——Excel文件转换 ——“请选择 Excel文
件中的一个表”,在“从 …,下面的对话框中输入
Excel的文件名称,在“选择表”下面的对话框中输
入哪张表( sheet),然后,点击“下一页”,进入
,Excel文件的转换”对话框。
Excel文件转换
存为 SAS数据表,
SAS数据库:确定数据库;
数据表,确定数据集的名称;
“第一行作为字段名”、“从第几行开始取数据
”、“估计字符字段最大长度”、“选择转换的列数
”,这些选项都和前面一样。点击“确定”则显示数
据表,再点击“修改属性”,可修改变量名称、变量
标签和类型。修改完毕后,直接退出即可。
Excel文件转换
合并文件指将两个 SAS数据集合并为一个数据集
,合并的方式有三种:
1、两个数据集变量相同,只增加观测数;
2、两个数据集中的观测代码相同,只增加变量;
3、根据观测的代码,同时增加变量或观测。
合并文件
合并的步骤:
数据管理 ——合并数据集 ——“数据集合并”对话框
:
数据集合并类型,只能选择三种中的一种;
数据集 1和数据集 2:选择需合并的数据集;
输出数据集,输入合并后数据集的名称;
以上内容选择完毕后,点击“运行”,即生成合
并后的数据集。
合并文件
加工数据集
加工数据集是在原有数据集的基础上,可增加变
量,或改变原有变量的属性。
1、增加变量:根据已有的变量,通过运算,产生新的
变量。
2、修改数据集:改变原有变量的标签、输入格式、输
出格式或变量值。
步骤:数据管理 ——加工数据集 ——增加变量
选择数据集,选择原有的数据集,选择后在“加工前
数据集”框内显示数据集的内容;
增加变量,点击后出现“变量属性”对话框,框中包
括新变量的变量类型、长度、输入格式、输出格式、
变量名、变量标签及运算公式。
增加变量
新产生的变量及原来数据集中的变量会在
“加工后的数据集”对话框中显示,该数据集
可保存为另一个名称数据集,也将原有数据集
更新,保持原有数据集的名称。
增加变量
步骤:数据管理 ——加工数据集 ——修改数据集
选择数据集,选择需修改的数据集;
修改数据集,进入数据表,对原有的的某些属性进行
修改。
修改完毕后,直接退出即可。
修改数据集
数据集转置的目的是将行转换成列(即将
观测转换成变量),也可以列转换成行(即将
变量转换成观测)。其步骤如下:
数据管理 —— SAS数据集转置 —— 对话框
数据集转置
输入数据集:选择需转置的数据集;
输出数据集:输入转置后数据集的名称;
转置变量,选择需转置的变量;
分组变量,在新数据集中以该变量的值进行分组;
输出变量名:以该变量的值作为新数据集中变量名。
数据集转置
(Statistical Analysis System)
SAS 系统
—— 数据处理和统计领域的国际标准软件
—— 世界领先的数据分析和信息系统
引 言
? SAS 被评为, 最佳数据仓库 /商业智能解决方
案供应商,
在 DM Review杂志 2000年度, 最佳数据仓库 /商业智
能解决方案供应商, 选举当中,SAS领先于 Microsoft,
IBM和 Oracle等著名厂家,名列榜首。这是 SAS 连续两年
荣获该项荣誉。
引 言
SAS 系统的发展:
统计分析软件 → 大型集成应用软件系统
具有完备的数据访问、管理、分析、呈现及应用开
发等功能
SAS 系统已经被成功应用于 120多个国家和地区的
31,000多个机构中,直接用户超过 3,500,000人。
引 言
安装与启动
( 1)运行光盘中“安装学习版”目录下的 SETUP.EXE;
( 2)运行密码更新程序,UPDATE.EXE;
( 3)安装完成后,运行安装目录下的 SAS.EXE,或运行桌面
上的快捷方式。
注意,在安装过程中,选择的安装路径不能用长文件名和包含
中文字符。
数据集和数据库
数据集 (data set):存放数据,该文件的后缀名为 sd2;
数据库 (library):存放数据集 (相当与 windows下的文件
夹 ),用 库标记 表示文件夹。
SAS系统中数据集文件的表达方式:库标记,数据集
名(如 sasuser.build)
数据集的类型,
● 临时数据集,在 SAS程序中产生的不带库标记(或库标记
为 work) 的数据集,一般存放在 saswork文件夹内,退出 SAS
系统后,该文件被自动删除。
● 永久数据集,退出 SAS也存在于磁盘上的数据集。
数据集和数据库
● 通过“数据采集”按钮创建;
● 在“交互数据分析”中新建数据集;
● 在“分析员应用”中新建数据集;
● 运用编程的方法创建。
数据集的创建
一、通过, 数据采集, 创建数据集,
数据采集 ———— 创建、查看数据集
———— 进入数据编辑窗口
数据集的创建
数据集框架,
列的顶端 (A,B,C,…) 为变量 (variable)
的名称;行的最左侧 (1,2,3,…) 为观测
(observation) 的次序 ; 某行某列的交界处为
某观测的某变量的测量值。
数据集的创建
变量名 (name),只能用英文字符或数字表示,
最大长度为 8个字符,双击变量名可修改。
变量标签 (label),表示变量的含义,可输入多
个字符,也可以输入中文。
数据集的创建
变量类型
· 字符型 (character),一般表示计数资料;
· 数值型 (numeric),一般表示计量资料,也可
表示等级资料。
数据集的创建
变量长度 (length)
· 字符型变量, 1-200个字符
· 数值型变量, 1-32位
数据集的创建
输入和输出格式
· 输入格式 (informat),是 SAS系统用于读入数
据值到某个变量中的一个指令;
· 输出格式 (format),是 SAS系统用于输出数据
值的一个指令。
数据集的创建
二、运行“交互数据分析”新建数据集,
交互数据分析 ——SAS/insight,Open对话框
——New——进入数据集编辑窗口,新数据集
文件名为 work.a
数据集的创建
点击窗口最左上角的三角形,”,选择
,new
variable”,确定需建立的变量的个数。默认的
变量名为 A,B,C…… 。 可双击变量名改变变
量名及其属性。
▼
数据集的创建
测量水平( measurement level)
● 区间型( interval)
● 列名型或名义型( nominal)
区间型变量必须是数值型变量,可以对其
观测值进行运算,计算各种统计量;名义型变
量可以是数值型,也可以是字符型,通常起分
类的作用。
数据集的创建
三、运行“分析员应用”新建数据集,
点击分析员应用,出现左右两个窗口,左
侧为分析结果的目录树,右侧为空白数据表,
双击变量名可改变变量名,在数据表中直接可
直接输入数据。
数据集的创建
四、运用编程的方法创建数据集
例,data sasuser.a;
input x1 x2 $@@;
cards;
12 m 13 m 14 f 12 f 15 m 17 f;
run;
数据集的创建
文本文件快速转换
主要功能:将文本文件转换为 SAS数据集
数据采集 ——文本文件快速转换 ——文本数据
转入 ---定义外部数据源对话框(“数据说明”
和
“存为 SAS数据表”两个对话框)
“数据说明”对话框的内容:
1、输入文本数据源:指定文本文件的位置。
2、第一行作为字段名:如选择,则文本文件中的第一行的内容被定
义为数据集的变量名,如不选择,则数据集中的变量名自动定义为
X1,X2,X3等。
3、选择需转换的列:输入需转换的列数。
4、从第几行取值:输入数值
5、估计字符字段最长位数:输入数值
6、字段间所用间隔符:空格( blank),制表符( tab),逗号、
分号、竖线、斜线等。
文本文件快速转换
“存为 SAS数据表”对话框的内容,
SAS数据库:选择已定义的数据库的名字
数据表:输入数据表(集)的名称
上述内容选择完毕后,点击“下一页”进
入“文本数据转换 —数据预览”
文本文件快速转换
在数据预览对话框中,可以看到所有数据
的格式都是字符型,点击“修改属性”进入修
改数据属性对话框,可改变变量名、变量标签
和变量的类型。修改后点击“确定”回到“数
据预览”对话框,再点击“确定”就将文本文
件转换位 SAS数据集。
文本文件快速转换
主要功能:
1、列输入格式的文本文件转换成 SAS数据集。
2,SAS数据集转换成其他格式的文件,如文本
格式( *.dat) 或 RTF格式。
文本文件转换
1、将列输入格式的文本文件转换为 SAS数据集
数据采集 —— 文本文件转换 ——,Import,
Column”对话框 ——, File”——“Import”
——,From External file”下面的对话框中输入
选择的文本文件。
文本文件转换
,To (SAS file)”:
Library:选择数据库;
Member:输入数据集的名称;
Data file 或 Data view:任选其中一个。
Use template:选择模板。
选择完毕后,按,ok”确定。
文本文件转换
Field Name:输入变量名
Descriptive label:变量标签
Begin:起始列号 End:结束列号
Length:变量长度 (自动判别 )
Character / Numeric:变量类型 (字符 /数值)
Informat /format:输入和输出格式(自动判别)
文本文件转换
每个变量的各项选项输入完毕后,按
,Add”将该变量填加到数据集中,当所有变量
输入完毕后,需保存数据集文件,file—save。
文本文件转换
2、将 SAS数据集转换为其他格式的文件
数据采集 —— 文本文件转换 ——,Import,
Column”对话框 ——, File”——“Export”
——,From (SAS file)”对话框中输入选择的
SAS数据集。,To External file”对话框中输入
外
部文件的文件名。,ok”确定。
文本文件转换
缺省状态为将所有变量全部输出,也可根
据自己的需要,选择需输出的变量:点击不
输出的变量,再点击,Exclude”,则去除该
变量。如再需要,再点击该变量,则
,Exclude”变成,Include”,点击后重新将
该变量输出。
文本文件转换
SAS学习版可直接将 Excel中的数据转换为
SAS数据集,具体操作:
数据采集 ——Excel文件转换 ——“请选择 Excel文
件中的一个表”,在“从 …,下面的对话框中输入
Excel的文件名称,在“选择表”下面的对话框中输
入哪张表( sheet),然后,点击“下一页”,进入
,Excel文件的转换”对话框。
Excel文件转换
存为 SAS数据表,
SAS数据库:确定数据库;
数据表,确定数据集的名称;
“第一行作为字段名”、“从第几行开始取数据
”、“估计字符字段最大长度”、“选择转换的列数
”,这些选项都和前面一样。点击“确定”则显示数
据表,再点击“修改属性”,可修改变量名称、变量
标签和类型。修改完毕后,直接退出即可。
Excel文件转换
合并文件指将两个 SAS数据集合并为一个数据集
,合并的方式有三种:
1、两个数据集变量相同,只增加观测数;
2、两个数据集中的观测代码相同,只增加变量;
3、根据观测的代码,同时增加变量或观测。
合并文件
合并的步骤:
数据管理 ——合并数据集 ——“数据集合并”对话框
:
数据集合并类型,只能选择三种中的一种;
数据集 1和数据集 2:选择需合并的数据集;
输出数据集,输入合并后数据集的名称;
以上内容选择完毕后,点击“运行”,即生成合
并后的数据集。
合并文件
加工数据集
加工数据集是在原有数据集的基础上,可增加变
量,或改变原有变量的属性。
1、增加变量:根据已有的变量,通过运算,产生新的
变量。
2、修改数据集:改变原有变量的标签、输入格式、输
出格式或变量值。
步骤:数据管理 ——加工数据集 ——增加变量
选择数据集,选择原有的数据集,选择后在“加工前
数据集”框内显示数据集的内容;
增加变量,点击后出现“变量属性”对话框,框中包
括新变量的变量类型、长度、输入格式、输出格式、
变量名、变量标签及运算公式。
增加变量
新产生的变量及原来数据集中的变量会在
“加工后的数据集”对话框中显示,该数据集
可保存为另一个名称数据集,也将原有数据集
更新,保持原有数据集的名称。
增加变量
步骤:数据管理 ——加工数据集 ——修改数据集
选择数据集,选择需修改的数据集;
修改数据集,进入数据表,对原有的的某些属性进行
修改。
修改完毕后,直接退出即可。
修改数据集
数据集转置的目的是将行转换成列(即将
观测转换成变量),也可以列转换成行(即将
变量转换成观测)。其步骤如下:
数据管理 —— SAS数据集转置 —— 对话框
数据集转置
输入数据集:选择需转置的数据集;
输出数据集:输入转置后数据集的名称;
转置变量,选择需转置的变量;
分组变量,在新数据集中以该变量的值进行分组;
输出变量名:以该变量的值作为新数据集中变量名。
数据集转置