多元统计分析的理论基础
一、矩阵
二、多元正态分布
一、矩阵基础知识
? 例:在一项实验中,测得大豆的周龄
x(以周计 )和平均高度 y(厘米 )的数据如
下,
? 求两变量的协方差阵和相关系数阵。
第 1章 多元正态分布
? 一、多元分布的基本概念
? 见书第 3页定义 1.1,
? 设 X1,X2,······Xp为 p个随机变量,由它
们组成的向量 X=(X1,X2,······Xp)称为随机向
量。
?2、分布函数与密度函数
? 多元分布函数及密度函数(见定义 1.2; 1.3)
? 例:口袋中有 2白球 3黑球,有放回取两
次,每次任取一球,设 X为第一次得白球
数,Y为第二次得白球数,
? 求 (X,Y)的联合分布,
? 联合分布和边际分布
?3、多元变量的独立性
? 多元变量的联合分布等于各自分布的乘
积,称 p个随机向量 X1,X2···Xp相互独
立。
? 由 X1,X2···Xp相互独立可以推出 Xi,Xj
独立 (i,j不相等)。
?Xi,Xj独立 (i,j不相等),不能 推出 X1、
X2···Xp相互独立
? 4、随机变量的数字特征
? ( 1)随机向量的均值
? ( 2)随机向量 X的自协方差阵
? ( 3)随机向量 X和 Y的协方差阵
? ( 4)随机向量的 X的相关阵
? 以二元随机变量为例,
? ( 1)均值
? ( 2)协方差阵
?
? ( 3)两组随机向量 X和 Y的协方差阵 (见
书 P5)
? ( 4) 相关系数矩阵
? 例,益寿宁的降血脂效果
? 求均值向量和协方差阵、相关系数矩阵
? ( 1)均值
? ( 2)协方差,
? ( 3)相关系数矩阵=?
? 二、多元正态分布
?1、定义(见书定义 1.5)
?2、性质
? 每一个变量均服从正态分布
? 变量的线性组合服从正态分布
?m元正态分布中的任意 k个变量服从 k元正
态分布
?m元正态分布的条件分布仍服从正态分布
? 协方差为 0的变量间相互独立 。
?3、条件分布和独立性(见书 P13)
? 三、统计距离和马氏距离 **
? 1、欧氏距离(直线距离)
? ( 1)定义
? ( 2)缺陷
? ( 3)标准化处理的必要
?2、统计距离-马氏距离
? ( 1)定义
? ( 2)优点
? ( 3)马氏距离的四条公理
? 四、均值向量和协方差阵的估计 **
? 五、维希特分布 ( Wishart)
? 详见书,17- 18页