高等统计学：高级统计学(7)

分类：数学格式：ppt 日期：2008年10月07日

第七章结构方程模型哈尔滨工业大学管理学院葛虹主要内容
为何要用结构方程模型？
结构模型原理
结构方程的建立
科研案例
结构方程的 Amos实现两个简单的结构方程国民收入发展保障人均 GDP
社会和谐城镇收入农村纯收入新增固定资产卫生机构数高校数犯罪率离婚率投诉率义务教育普及率医保率养老保险投保率
1?
2?
X
Y
工作自主权工作方式选择工作目标调整工作满意度目前工作满意度工作兴趣工作乐趣工作厌恶程度

X Y
为何要用结构方程模型？
很多社会、心理研究中所涉及到的变量,都不能准确、直接地测量,这种变量称为潜变量,如工作自主权、工作满意度等,
这时,只能退而求其次,用一些外显指标,去间接测量这些潜变量,如用工作方式选择、工作目标调整作为工作自主权 (潜变量 )的指标,以目前工作满意度、
工作兴趣、工作乐趣、工作厌恶程度 (外显指标 )作为工作满意度的指标,
传统的统计分析方法不能妥善处理这些潜变量,而结构方程模型则能同时处理潜变量及其指标,
结构方程模型 (SEM)的优点
同时处理多个因变量
容许自变量和因变量含测量误差
同时估计因子结构和因子关系
容许更大弹性的测量模型
估计整个模型的拟合程度 (用以比较不同模型 )
SEM包括,回归分析、因子分析 (验证性因子分析,探索性因子分析 ),ｔ检验、方差分析、比较各组因子均值、交互作用模型、实验设计
SEM分析的基本程序
根据已经有的理论和研究成果,事前对因子分析的结果做出合理的理论假设；
从理论假设出发,检验理论假设与数据是否相符,即从数据的角度检验假设的合理性；
研究结果依赖于假设与数据的吻合程度,通过检验修改原假设,从而发展和建立新的理论,
SEM分析流程图理论模型发展阶段估计与评价阶段理论性发展模型设定讨论与结论模型识别参数估计模型修正模型拟合度估计
Structural Equation Model,SEM
Covariance Structure Modeling,CSM
Linear Structural Relationship,LISREL
从上述名称中可以看出，结构方程模型的几个本质特征是：
结构方程模型的含义结构线性协方差结构方程简介
结构方程模型分为：
测量方程 (measurement
equation)和结构方程
(structural equation)
测量方程描述潜变量与指标之间的关系,如工作方式选择等指标与工作自主权的关系；
工作自主权工作方式选择工作目标调整工作满意度目前工作满意度工作兴趣工作乐趣工作厌恶程度
测量方程描述潜变量与指标之间的关系,如工作方式选择等指标与工作自主权的关系；
结构方程描述潜变量之间的关系,如工作自主权与工作满意度的关系,
工作自主权工作满意度测量模型

y
x
Y
X
外生指标内生指标外生潜变量内生潜变量外生因子载荷内生因子载荷其中,X— 外源指标 (如两个工作自主权指标 )组成的向量；
Y— 内生指标 (如四个工作满意度指标 )组成的向量；
— 外源潜变量 (如工作自主权等 )组成的向量；
— 内生潜变量 (如工作满意度等 )组成的向量；
— 外源指标与外源变量之间的关系 (如两个工作自主权指标与工作自主权的关系 ),是外源指标在外源潜变量上的因子负荷矩阵；
— 内生指标与内生变量之间的关系 (如四个工作满意度指标与工作满意度的关系 ),是内生指标在内生潜变量上的因子负荷矩阵；

y
x
Y
X
x?
y?
结构模型
B
内生潜变量之间的关系系数外生潜变量对内生潜变量的影响系数结构的残差项其中,B— 内生潜变量间的关系 (如其它内生潜变量与工作满意度的关系 )；
— 外源潜变量对内生潜变量的影响 (如工作自主权对工作满意度的影响 )；
— 结构方程的残差项,反映了在方程中未能被解释的部分。
B
潜变量间的关系,即结构模型,是研究的兴趣重点,所以整个分析也称结构方程模型。
结构模型的建立
模型建构 (model specification)
模型拟合 (model fitting)
模型评价 (model assessment)
模型修正 (model modification)
模型建构
一是建立显变量 (即指标,通常是题目 )与潜变量 (即因子,通常是概念 )的关系；
二是建立各潜变量间的相互关系 (即指定那些因子间相关或直接效应 )；
三是在复杂的模型中,可以限制因子载荷或因子相关系数等参数的值,
例子：员工工作满意度的测量理论假设与概念模型的提出
研究指出,有多种因素影响到工作满意度,其中包括工作内容的奖励价值、多样性、学习机会、困难性以及对工作的控制等,因此,假设：
假设 1 工作自主权越高,工作满意度越高,工作自主权是指员工可以运用相关工作权利的程度,有较高工作自主权的员工,将具有较高的工作满意度,
假设 2 工作负荷越高,工作满意度越低,工作负荷是指工作职责不能被实现的程度,工作压力会使员工处于有害身心健康的状况中,有碍于员工对工作的积极态度,工作压力会降低工作满意度,
假设 3 工作单调性越高,工作满意度越低,工作单调性是指个体的工作被重复的程度,如煤炭采掘一线的职工工作单调性比较高,而机关科室的单调性就比较低,
概念模型
工作满意度目前工作满意度工作兴趣工作乐趣工作厌恶程度工作自主权工作方式选择工作目标调整工作负荷工作单调性任务完成时间充裕度工作负荷轻重工作节奏快慢工作内容丰富程度工作多样性程度
x
y
模型拟合与模型识别
结构方程拟合的目标是求解参数或路径系数使得结构方程隐含的协方差阵 Σ(Θ)与样本协方差阵 S的,差距
” 最小；
矩阵之间的,差距,有多种不同的定义方法,不同的定义方法产生不同的拟合结果以及相应的参数估计；
最常用的估计方法,极大似然法 (经过迭代完成求解过程 )
)()t r (l o g)(l o g 1ML qpSSF
样本协方差矩阵模型模型协方差矩阵最大似然估计法适用范围
变量是多元正态分布；
利用协方差矩阵进行分析；
两到四因子模型,样本量最少大于 100,大于
200更好；
由于 ML估计是稳健估计,即使变量不服从多元正态分布,在大样本情况下,ML估计仍是可以使用的,
模型识别
识别涉及参数估计至少有一个唯一解的概念
只有一个可能解的模型称为恰好识别
有无限可能参数估计值的模型叫做欠识别
参数估计多于一个可能解 (除了一个最优解外 )的模型叫做过度识别
建立 SEM多数使用过度识别模型
AMOS把执行识别检查作为模型拟合过程的一部分,通常提供有关欠识别条件的警告
欠识别时的补救方法：收集更多的数据或重新定义模型模型识别原理
ξ
x1
ηx
2
x3
y1
y2
1 1
λ2
λ4
λ5
γ
11y
222y
11x
242x
353x

1
1
1
1
1δ
3
δ2
δ1 ε
1
ε2
1
ζ
结构方程组
11y
222y
11x
242x
353x

2
1
22
1 1

y
y
3
2
1
5
4
3
2
1 1
x
x
x

测量方程 1测量方程 2
结构方程
变量 (y1,y2,x1,x2,x3,)的协方差阵
已知样本协方差的个数

)v a r (),c o v (),c o v (),c o v (),c o v (
)v a r (),c o v (),c o v (),c o v (
)v a r (),c o v (),c o v (
)v a r (),c o v (
)v a r (
323132313
2122212
12111
212
1
xxxxxyxyx
xxxyxyx
xyxyx
yyy
y
152/)15(554321
根据方程组推出的总体协方差阵为
未知参数的个数未知路经系数 +所有误差的方差 +一个潜变量的方差
=4+6+1=11

3
2
545525
2
5
2
2
44244
12
2
22
2
2
2
1
2
)()(
)(

误差项的方差
ξ 的方差模型可识别的必要条件模型中自由参数的个数
2
)1)(( qpqp
模型参数的估计表 1 标准化路径系数（ N=351）
变量变量间关系工作满意度标准化路径系数 t检验值工作自主权 ξ1— η 0.206 2.562
工作负荷 ξ 2— η -0.212 -1.575
工作单调性 ξ 3— η -0.378 -2.857
注,t检验值 >1.96表示在 0.05的显著水平下通过显著性检验
1?
工作满意度目前工作满意度工作兴趣工作乐趣工作厌恶程度工作自主权工作方式选择工作目标调整工作负荷工作单调性任务完成时间充裕度工作负荷轻重工作节奏快慢工作内容丰富程度工作多样性程度
y
0.206
-0.212
-0.378
2?
3?
x
模型评价
结构方程的解是否恰当 (相关系数应在 +1和 -1之间 )
变量变量间关系工作满意度标准化路径系数 t检验值工作自主权 ξ1— η 0.206 2.562
工作负荷 ξ 2— η -0.212 -1.575
工作单调性 ξ 3— η -0.378 -2.857
（ -1,+1 ）
参数与预计模型的关系是否合理 (与模型假设相符 )
假设 1：工作自主权越高，工作满意度越高。
假设 2：工作负荷越高，工作满意度越低。
假设 3：工作单调性越高，工作满意度越低。
+
－
－
√
√
未通过 t检验
检验不同类型的整体拟合指数 (各项拟合优度指标是否达到要求 )
表 2 模型拟合优度结果指标 DF χ2 P NFI NNFI CFI IFI GFI AGFI RFI RMR RMSEA
指标值 687 1386.64 0.0 0.901 0.937 0.950 0.951 0.861 0.817 0.861 0.0584 0.0457
规范拟合指数不规范拟合指数比较拟合指数增量拟合指数拟合优度指数调整的拟合优度指数相对拟合指数均方根差近似均方根差
Χ2/DF= 1386.64/ 687=2.018
第一个指标是卡方统计量与自由度的比值,卡方值与自由度之比在 2:1到 3:1之间是可以接受的
第二个指标是 P值,P值越大越好,当 P>0.05时,接受结构方程的协方差阵与实际协方差阵相等的假设,
在大样本情况下：
NFI(NNFI CFI IFI GFI AGFI RFI )>0.9
RMR<0.035
RMSEA<0.08
表明模型与数据的拟合程度很好。
模型修正
依据理论或有关假设,提出一个或数个合理的先验模型；
检查潜变量 (因子 )与指标间的关系,建立测量模型,有时可能增删或重组指标；
对每一个模型,检查标准误,t值、标准化残差、修正指数、及各种拟合指数,据此修改模型并重复这一步；
最好用另外一个样本进行检验；
科研案例
蔡莉,于晓宇,杨隽萍,科技环境对风险投资支撑作用的实证研究,管理科学学报,
2007,10(4):73-80
摘要
对中国各地区风险投资科技环境 (STE)水平和风险投资 (VC) 水平分别进行了聚类分析,为了解释两者在聚类分析结果上的差异,对风险投资科技环境的评价指标和风险投资的评价指标分别进行了因子分析,并依据分析结果将风险投资科技环境按支撑主体分为两类,分别称为,培育性科技环境,和
,自发性科技环境,,最后,通过结构方程模型,验证了两类科技环境对风险投资支撑作用的差异,进一步揭示出风险投资科技环境与风险投资在聚类分析结果方面有差异的原因,
风险投资是风险投资公司将自己的资金、品牌、网络、管理等资源与风险企业的技术、
人力资源有机结合,实现风险企业高速成长,
并从中获得高额利润的过程,同任何事物的发展过程一样,风险投资从产生、发展,一直到成熟都离不开其所赖以生存的支撑环境,
风险投资的支撑环境是指有效实施风险资本交易行为所需要的各种主要外部要素及各要素组成的有机整体,这些支撑环境在风险投资的发展过程中起着极其关键的作用,
我国区域风险投资科技环境和区域风险投资状况的聚类分析风险投资环境教育经费支出高等学校 R&D 经费支出企业 R&D 经费支出事业单位 R&D 经费支出企业 R&D 人员数量科学研究及综合技术服务业 R&D 支出技术市场成交额科研机构与实验发展经费支出
3 种专利申请受理和授权量风险投资环境指标体系风险投资发展指标体系风险投资区域发展风险投资资本额占全国风险资本额的比例风险投资公司占全国风险投资公司的比例从事风险投资专业人员占全国专业人数的比例风险投资公司投资项目占全国项目数的比例风险投资科技环境区域聚类分析结果分类方法：采用重心法、平均联结法和离差平方和法风险投资区域发展聚类分析结果科技环境的因子分析提取因子方法都是主成分方法,因子提取的原则是其特征值大于 1,旋转方法是 Varimax
培育性科技环境自发性科技环境因子划分以及命名培育性科技环境教育经费支出高等学校 R&D 经费支出企业 R&D 经费支出事业单位 R&D 经费支出企业 R&D 人员数量科学研究及综合技术服务业 R&D 支出技术市场成交额科研机构与实验发展经费支出
3 种专利申请受理和授权量自发性科技环境
49,63 %
44,611%
风险投资发展水平的因子分析方差贡献率为 90,6 %
部分地区的因子得分结果不同支撑主体的科技环境对风险投资支撑作用分析
在对科技环境进行因子分析的过程中,看到培育性科技环境的方差贡献率为 49,63 %,而“自发性科技环境”的方差贡献率为 44,61 %,培育性科技环境仍然占据主要支撑要素地位,而根据已有的研究成果,
自发性科技环境因为其介入管理的灵活性,更能有效地支撑风险投资的发展,而培育性科技环境因为产权不明晰所导致的风险规避,对风险投资的支撑有限,因此本文给出如下假设：
.
相对于培育性科技环境而言,自发性科技环境对风险投资的发展具有更大的支撑作用统计软件 AMOS 验证模型结果在结构方程模型中,潜在变量,re”有两层含义,一是指收集、度量变量时所产生的数据误差 ;二是指没有建构在模型中,但对模型中的变量有作用的其它变量,本文中的潜在变量,re”的含义指后者,
即除“培育性科技环境”和“自发性科技环境”外,其他所有对
“风险投资”有影响的变量结论
从数据的分析结果来看,对于自发性科技环境对风险投资的发展具有更大的支撑作用的假设没有得到支持,这说明,与风险投资发达的国家相比,我国风险投资的发展更多地借助于以政府为支撑主体的培育性科技环境,因为虽然以企业和个人为支撑主体的自发性科技环境在研发支出上更具灵活性,
但由于和政府为研发支出支撑主体的培育性环境相比,目前我国大部分企业的研发支出小,无法为风险投资的发展提供最主要的支撑作用,而这种角色的错位正是我国风险投资发展缓慢的原因之一,