Statistical Program
for Social Sciences
第一讲 SPSS简介及数据编码录入
1 简介
SPSS是 Statistical Program for Social Sciences 的简
称,即社会科学统计程序,由美国 SPSS公司 1970
年代推出,迄今已有近 30年的历史。是国际著名
三大社会科学统计软件包之一( SAS,SPSS、
Statis)。我们现在使用的是 SPSS for Windows 8.0
版。
2 进入 SPSS之前的准备工作
2-1-1数据资料的形式:
矩阵式数据数据要求每一横行为一个个案( Case),
纵列按变量排列,形成矩阵格式。
2-1数据资料的形式及编码
编码
录入
2-1-2 编码的概念,
根据一定的规则将研究资料转换为可进行统计分析
的数码资料的过程。
问题 025:您认为打工的外地人对北京市的社会秩
序是否有影响?(单选)
1□ 有很大影响 2□ 有较大影响
3□ 没有影响 4□ 不好说 4
编码答案
2-1-3编码的步骤:
1)确定变量;
?变量:
用来反映文意概念的量化形式。在统计中往往指最
小的分析单位。编码就是对变量进行编码。变量由
两个部分构成,变量名 和 变量值 。要注意区分何为
变量,何为变量值。在调查问卷中还要注意区分 问
题 和 变量 。
问题 009:您有几个儿子?几个女儿?
1□ 儿子 _______人
2□ 女儿 ________人
2
3
问题
变量 1
变量 2
变量 1的值
变量 2的值
2)制作编码表
变量名 码位 码数 尺度 编码 不适用 不知道 未回答 缺失值 备注
num 1-4 4 I n t e r v a l D i r e c t
W01 5 1 C a t e g o r y D 9 9
W01a 6-7 2 I D 99 99
W02 8 1 C D 9 9
W03 9 1 O r d i n a l D 9 9
W04 10 1 O D 0,9
W05.1 11 1 C 0-1 9 9
W05.2 12 1 C 0-1 9 9
W05.3 13 1 C 0-1 9 9
W05.4 14 1 C 0-1 9 9
W05.5 15 1 C 0-1 9 9
W05.6 16 1 C 0-1 9 9
W05.7 17 1 C 0-1 9 9
W06 18 1 C D 9 9
W07 19 1 C D 7 9
W08.1 20-21 2 I D 97 98 99 99
W08.2 22-23 2 I D 97 98 99 99
W08.3 24-25 2 I D 97 98 99 99
直接过录
0-1编码
变量名, 一个数据文件中,
一个变量只能有一个唯一名称。 码位:某一变量在
数据文件中占据的栏位
码数:
某一变量由几位数组成。该变量是数值型( Numeric) —— 如定距、定比,
还是字串型( String),如定类、定序。
前者在统计中可以做高级运算,后者则不可以。
不适于被访人回答的问题的编码。
一般采用 7,97,997等。被访人回答不知道时的编码。一般采用 8,98,998等。被访人拒绝回答某变量时的编码。一般采用 9,99,999等。问卷中出现漏答时的处理编码。
一般采用 9,99,999等。
问题 001,您的性别:
1 □男 2 □女
问题 00 2,您目前的婚姻状况 (单选):
1 □未婚 2 □已婚 3 □离婚后未再婚
4 □离婚后再婚 5 □丧偶后未再婚
6 □丧偶后再婚 7 □未婚同居
2
3
问题 0 11,您家中是否有下列物品,(可多选)
1 □电话 2 □传真机 3 □有线电视
4 □卫星电视 5 □大哥大 6 □ BP 机
100011
3)编码:
根据编码表对问卷进行编码,而后将编码结果记录
在问卷上或编码纸上。
2-2 数据录入
外部式录入
内部式录入
采用 DOS,WPS,CCED等软件,按 ASCII码
方式录入成文本文件( *.dat; *.txt)。这种
录入方式的特点是,数据之间没有间隔,录
完一个数码后自动后移,录入速度较快。缺
点是容易错位。
采用 SPSS数据编辑器( SPSS Data Editor)录
入。其优点是不容易错位,缺点是不能自动
后移,录入速度慢,数据错误不容易修改。
作业:将问卷填答好,并做出问题
001— 问题 011的编码表,将自己的答案
在问卷上编码。下一节课带问卷上机。
练习:
第二讲 SPSS数据定义
SPSS的运行步骤如下,
录入数据
定义数据
整理数据
统计数据
察看结果
SPSS数据定义的命令共有 4个,分别用来定义数据
的 变量名, 变量名标签, 变量值标签 和 缺失值 。
1 变量名定义命令,Data List
1-1命令格式:
Data List File=‘原始数据文件名( *.dat)’
/变量 1名 码位 变量 2名 码位 …… 变量 n名 码位,
这些数据定义命令都要写在 SPSS的语句窗口
( Syntax)里,而后运行。
示例:
Data list file=’c:\lianxi\lianxi.dat’/
num 1-4 W01 5 W01a 6-7 W02 8 W03 9 W04 10.
或:
Data list file=’c:\lianxi\lianxi.dat’/
num 1-4
W01 5
W01a 6-7
W02 8
W03 9
W04 10.
1-2要求:
?变量名不能超过 8个字符;
?变量名不能以数字开头;
?变量名中不能包含+, -, ×, /,?, =等运
算和逻辑符号 。
?当相邻变量名称上存在顺序且码位相同时, 可
用简略方法,
W02 8 W03 9 W04 10.可换为 W02 to W04 8-10.
?当变量值是字符时, 在码位后加 ( a) ;如:
W7 12(a);
?当变量值包含小数时, 在码位后加 ( n), n表
示小数的位数 。 如,446.79,在录入时要录成
44679,定义时为,W12 12-16(2);
练习:
问卷 p1变量名定义;
问卷问题 010,011变量名定义;
问题 012变量名定义;
运行。
2 变量名标签定义命令,Variable labels
该命令是给变量名一个说明标注 。
2-1 命令格式:
Variable labels 变量 1名 标签 /变量 2名 标签
/变量 3名 标签 ………/ 变量 n名 标签,
示例:
Variable Labels num 编号 /W01 性别
/W01a 出生年 /W02 婚姻状况 /W03 文化程度,
或:
Variable Labels
num 编号
/W01 性别
/W01a 出生年
/W02 婚姻状况
/W03 文化程度,
或:
Variable Labels
num 编号
W01 性别
W01a 出生年
W02 婚姻状况
W03 文化程度,
2-2 要求:
?变量名要和已定义过的名称相一致;
?标签用中、西文均可,但长度不要超过 120个字符,
即 60个汉字。
练习:
问卷 p1变量名标签定义并运行。
3,变量值标签定义命令,Value labels
该命令是给变量的每一取值加一个说明标注 。
3-1 格式:
Value Labels 变量名 值 1 ‘标签’ 值 2 '标签
' 值 3 '标签 ' …
/变量名 值 1 ‘标签’ 值 2 ‘标签’ 值 3 ‘标
签’ …,
示例:
Value labels
W01 1'男 ' 2'女 '
/W02 1‘ 未婚 ’ 2‘ 已婚 ’ 3‘ 离婚后未再婚 ’ 4‘ 离
婚后再婚 ’
5‘ 丧偶后未再婚 ’ 6‘ 丧偶后再婚 ’ 7‘ 未婚同居 '
/W03 1‘ 不识字或识字很少 ’ 2‘ 初小 ’ 3‘ 高小 ’
4‘ 初中 ’
5‘ 高中中专或中技 ’ 6‘ 大专 ’ 7‘ 大学本科 ’
8‘ 研究生以上 ’
/W04 1‘ 不识字或识字很少 ’ 2‘ 初小 ’ 3‘ 高小 ’
4‘ 初中 ’
5‘ 高中中专或中技 ’ 6‘ 大专 ’ 7‘ 大学本科 ’
3-2 要求:
?变量名要和已定义过的名称相一致;
?标签用中、西文均可,但长度不要超过 60个字符,
即 30个汉字。
练习:
问卷问题 001— 007的变量值标签定义并运行。
4 缺失值定义命令,Missing Value
4-1 格式:
Missing Value 变量名 变量名 变量名 …… (缺失值 1,
缺失值 2,…… )
/变量名 变量名 变量名 …… (缺失值 1,缺失值
2,…… ),
示例:
Missing Value W01 W02 W03( 9) /W04 ( 0,9)
/W01a W8.1 W8.2 W8.3(99),
4-2 要求:
缺失值的定义与前面的命令格式不同,它是按照
缺失值的码位数来排列变量的。有相同码位数的
变量放在一组。
上机作业:
1、在 DOS下的 Edit编辑器下录入问卷。
2、运用 SPSS的 4个数据定义命令对问卷的
第一页进行定义。
for Social Sciences
第一讲 SPSS简介及数据编码录入
1 简介
SPSS是 Statistical Program for Social Sciences 的简
称,即社会科学统计程序,由美国 SPSS公司 1970
年代推出,迄今已有近 30年的历史。是国际著名
三大社会科学统计软件包之一( SAS,SPSS、
Statis)。我们现在使用的是 SPSS for Windows 8.0
版。
2 进入 SPSS之前的准备工作
2-1-1数据资料的形式:
矩阵式数据数据要求每一横行为一个个案( Case),
纵列按变量排列,形成矩阵格式。
2-1数据资料的形式及编码
编码
录入
2-1-2 编码的概念,
根据一定的规则将研究资料转换为可进行统计分析
的数码资料的过程。
问题 025:您认为打工的外地人对北京市的社会秩
序是否有影响?(单选)
1□ 有很大影响 2□ 有较大影响
3□ 没有影响 4□ 不好说 4
编码答案
2-1-3编码的步骤:
1)确定变量;
?变量:
用来反映文意概念的量化形式。在统计中往往指最
小的分析单位。编码就是对变量进行编码。变量由
两个部分构成,变量名 和 变量值 。要注意区分何为
变量,何为变量值。在调查问卷中还要注意区分 问
题 和 变量 。
问题 009:您有几个儿子?几个女儿?
1□ 儿子 _______人
2□ 女儿 ________人
2
3
问题
变量 1
变量 2
变量 1的值
变量 2的值
2)制作编码表
变量名 码位 码数 尺度 编码 不适用 不知道 未回答 缺失值 备注
num 1-4 4 I n t e r v a l D i r e c t
W01 5 1 C a t e g o r y D 9 9
W01a 6-7 2 I D 99 99
W02 8 1 C D 9 9
W03 9 1 O r d i n a l D 9 9
W04 10 1 O D 0,9
W05.1 11 1 C 0-1 9 9
W05.2 12 1 C 0-1 9 9
W05.3 13 1 C 0-1 9 9
W05.4 14 1 C 0-1 9 9
W05.5 15 1 C 0-1 9 9
W05.6 16 1 C 0-1 9 9
W05.7 17 1 C 0-1 9 9
W06 18 1 C D 9 9
W07 19 1 C D 7 9
W08.1 20-21 2 I D 97 98 99 99
W08.2 22-23 2 I D 97 98 99 99
W08.3 24-25 2 I D 97 98 99 99
直接过录
0-1编码
变量名, 一个数据文件中,
一个变量只能有一个唯一名称。 码位:某一变量在
数据文件中占据的栏位
码数:
某一变量由几位数组成。该变量是数值型( Numeric) —— 如定距、定比,
还是字串型( String),如定类、定序。
前者在统计中可以做高级运算,后者则不可以。
不适于被访人回答的问题的编码。
一般采用 7,97,997等。被访人回答不知道时的编码。一般采用 8,98,998等。被访人拒绝回答某变量时的编码。一般采用 9,99,999等。问卷中出现漏答时的处理编码。
一般采用 9,99,999等。
问题 001,您的性别:
1 □男 2 □女
问题 00 2,您目前的婚姻状况 (单选):
1 □未婚 2 □已婚 3 □离婚后未再婚
4 □离婚后再婚 5 □丧偶后未再婚
6 □丧偶后再婚 7 □未婚同居
2
3
问题 0 11,您家中是否有下列物品,(可多选)
1 □电话 2 □传真机 3 □有线电视
4 □卫星电视 5 □大哥大 6 □ BP 机
100011
3)编码:
根据编码表对问卷进行编码,而后将编码结果记录
在问卷上或编码纸上。
2-2 数据录入
外部式录入
内部式录入
采用 DOS,WPS,CCED等软件,按 ASCII码
方式录入成文本文件( *.dat; *.txt)。这种
录入方式的特点是,数据之间没有间隔,录
完一个数码后自动后移,录入速度较快。缺
点是容易错位。
采用 SPSS数据编辑器( SPSS Data Editor)录
入。其优点是不容易错位,缺点是不能自动
后移,录入速度慢,数据错误不容易修改。
作业:将问卷填答好,并做出问题
001— 问题 011的编码表,将自己的答案
在问卷上编码。下一节课带问卷上机。
练习:
第二讲 SPSS数据定义
SPSS的运行步骤如下,
录入数据
定义数据
整理数据
统计数据
察看结果
SPSS数据定义的命令共有 4个,分别用来定义数据
的 变量名, 变量名标签, 变量值标签 和 缺失值 。
1 变量名定义命令,Data List
1-1命令格式:
Data List File=‘原始数据文件名( *.dat)’
/变量 1名 码位 变量 2名 码位 …… 变量 n名 码位,
这些数据定义命令都要写在 SPSS的语句窗口
( Syntax)里,而后运行。
示例:
Data list file=’c:\lianxi\lianxi.dat’/
num 1-4 W01 5 W01a 6-7 W02 8 W03 9 W04 10.
或:
Data list file=’c:\lianxi\lianxi.dat’/
num 1-4
W01 5
W01a 6-7
W02 8
W03 9
W04 10.
1-2要求:
?变量名不能超过 8个字符;
?变量名不能以数字开头;
?变量名中不能包含+, -, ×, /,?, =等运
算和逻辑符号 。
?当相邻变量名称上存在顺序且码位相同时, 可
用简略方法,
W02 8 W03 9 W04 10.可换为 W02 to W04 8-10.
?当变量值是字符时, 在码位后加 ( a) ;如:
W7 12(a);
?当变量值包含小数时, 在码位后加 ( n), n表
示小数的位数 。 如,446.79,在录入时要录成
44679,定义时为,W12 12-16(2);
练习:
问卷 p1变量名定义;
问卷问题 010,011变量名定义;
问题 012变量名定义;
运行。
2 变量名标签定义命令,Variable labels
该命令是给变量名一个说明标注 。
2-1 命令格式:
Variable labels 变量 1名 标签 /变量 2名 标签
/变量 3名 标签 ………/ 变量 n名 标签,
示例:
Variable Labels num 编号 /W01 性别
/W01a 出生年 /W02 婚姻状况 /W03 文化程度,
或:
Variable Labels
num 编号
/W01 性别
/W01a 出生年
/W02 婚姻状况
/W03 文化程度,
或:
Variable Labels
num 编号
W01 性别
W01a 出生年
W02 婚姻状况
W03 文化程度,
2-2 要求:
?变量名要和已定义过的名称相一致;
?标签用中、西文均可,但长度不要超过 120个字符,
即 60个汉字。
练习:
问卷 p1变量名标签定义并运行。
3,变量值标签定义命令,Value labels
该命令是给变量的每一取值加一个说明标注 。
3-1 格式:
Value Labels 变量名 值 1 ‘标签’ 值 2 '标签
' 值 3 '标签 ' …
/变量名 值 1 ‘标签’ 值 2 ‘标签’ 值 3 ‘标
签’ …,
示例:
Value labels
W01 1'男 ' 2'女 '
/W02 1‘ 未婚 ’ 2‘ 已婚 ’ 3‘ 离婚后未再婚 ’ 4‘ 离
婚后再婚 ’
5‘ 丧偶后未再婚 ’ 6‘ 丧偶后再婚 ’ 7‘ 未婚同居 '
/W03 1‘ 不识字或识字很少 ’ 2‘ 初小 ’ 3‘ 高小 ’
4‘ 初中 ’
5‘ 高中中专或中技 ’ 6‘ 大专 ’ 7‘ 大学本科 ’
8‘ 研究生以上 ’
/W04 1‘ 不识字或识字很少 ’ 2‘ 初小 ’ 3‘ 高小 ’
4‘ 初中 ’
5‘ 高中中专或中技 ’ 6‘ 大专 ’ 7‘ 大学本科 ’
3-2 要求:
?变量名要和已定义过的名称相一致;
?标签用中、西文均可,但长度不要超过 60个字符,
即 30个汉字。
练习:
问卷问题 001— 007的变量值标签定义并运行。
4 缺失值定义命令,Missing Value
4-1 格式:
Missing Value 变量名 变量名 变量名 …… (缺失值 1,
缺失值 2,…… )
/变量名 变量名 变量名 …… (缺失值 1,缺失值
2,…… ),
示例:
Missing Value W01 W02 W03( 9) /W04 ( 0,9)
/W01a W8.1 W8.2 W8.3(99),
4-2 要求:
缺失值的定义与前面的命令格式不同,它是按照
缺失值的码位数来排列变量的。有相同码位数的
变量放在一组。
上机作业:
1、在 DOS下的 Edit编辑器下录入问卷。
2、运用 SPSS的 4个数据定义命令对问卷的
第一页进行定义。