定量资料的统计描述
完成统计描述的方法
1、运用编程的方法完成
2、用“交互数据分析”完成
3、用“分析员分析”完成
一、运用编程的方法完成
可以用 means 或 univariate过程。
proc means data=data.d3_1;
var x y z;
run;
proc univariate data=data.d3_1;
Run;
常用统计量的符号
N,例数 Mean,算术均数
Variance,方差 Std Dev,标准差
CV,变异系数
Std error 或 Std mean,标准误
Skewness,偏度系数
Kurtosis,峰度系数
正态性检验
proc univariate normal;run;
结果,W:Normal 0.932772
Pr<W 0.3843
结论:该组数据符合正态分布。
频数分布表数据的计算
data uni2;input x f @@;cards;
65 3 67 5 69 8 71 11 73 25 75 24
77 10 79 7 81 6 83 0 85 1;
proc univariate;var x;freq f;run;
几何均数的计算 (只能用编程计算 )
data logmean;input x f @@;y=log10(x);cards;
20 2 40 3 80 6 160 1 320 1;
proc means;freq f;var y;
output out=outmean mean=logmean;
data geomean;set outmean;g=10**logmean;
proc print data=geomean;var g;run;
结果:几何均数为 1, 64.6346
二、运用“交互数据分析”
1,Analyze — Distribution(Y)
2,在变量表中选择分析变量,再点 Y。
3,Output 选择分析项目。
( 1) Moment 描述性统计量
二、运用“交互数据分析”
( 2) Quantile 百分位数,中位数 (50% Med),四
分位间距 (Q3-Q1),极差 (Range),众数 (Mode);
( 3) Cumulative Distribution — Test
Distribution — normal 正态性检验;
结果,Kolmogorov D Prob > D
( 4) 95% C.I,For mean 均数的 95%可信区间
三、运用“分析员应用,
方法 1:
1,Statistics— Descriptive— Summary Statistics
2,在左侧框中选择分析变量,再点 Analysis
3,点击 Statistics,在需要计算的统计量前面的小框中
打勾,点击 OK返回。
4、点击 Output,选择字段宽度( Field width) 和有效
小数位数( Number of decimals)。
三、运用“分析员应用,
方法 2:
1,Statistics— Descriptive— distributions;
2,在左侧框中选择分析变量,再点 Analysis;
3,作正态性检验,fit— normal— OK;
4,完成选择后,点击 OK。
样本均数的比较
一、两组均数比较 —配对资料 t检验
采用编程的方法完成:
可以用 means 或 univariate过程。
proc means data=data.d4_1 t prt;
var d;run;
proc univariate data=data.d4_1;
Var d;run;
一、两组均数比较 —配对资料 t检验
结果:
Analysis Variable, D
Mean Std Error T( T值) Prob>|T|(P值 )
--------------------------------------------
-6.8000000 5.2042717 -1.3066189 0.2237
--------------------------------------------
一、两组均数比较 —配对资料 t检验
采用“交互数据分析,的方法完成:
1、交互数据分析 — 选择数据集;
2,Analyze— Distribution(Y);
3,选择分析变量 D,点击,y”;
4,output— location Tests,选择 student’s T Test
5,选择完毕后,点击,OK”。
一、两组均数比较 —配对资料 t检验
采用“分析员应用,的方法完成:
1、分析员应用 — file— Open by SAS name;
2,Statistics— Hypothesis Tests— two sample
Paired t-Test for mean …
3,选择两个分析变量,x1和 x2,分别点击,group 1”
和,group 2”;
5,选择完毕后,点击,OK”。
二,两组均数比较 —不配对资料 t检验
采用编程的方法完成:
可以用 ttest过程。
proc ttest data=data.d4_1;
class c;
var d;
run;
二,两组均数比较 —不配对资料 t检验
结果:
TTEST PROCEDURE
Variable,X 钩虫数量
C N Mean Std Dev Std Error
---------------------------------------------------
1 5 290.40000000 56.99385932 25.48842875
2 3 271.00000000 40.58324778 23.43074903
?
Variances T DF Prob>|T|
---------------------------------------
Unequal 0.5603 5.6 0.5971
Equal 0.5099 6.0 0.6284
For H0,Variances are equal,
F' = 1.97 DF = (4,2) Prob>F' = 0.7272
结果:
2
二,两组均数比较 —不配对资料 t检验
二,两组均数比较 —不配对资料 t检验
采用“分析员应用,的方法完成:
1、分析员应用 — file— Open by SAS name;
2,Statistics— Hypothesis Tests— two sample
t-Test for mean …
3,选择分析变量,x,点击,dependent”
选择分组变量,c,点击,group”;
4,选择完毕后,点击,OK”。
二,两组均数比较 —不配对资料 t检验
采用“分析员应用,的方法完成方差齐性检验:
1、分析员应用 — file— Open by SAS name;
2,Statistics— Hypothesis Tests— two sample
t-Test for variance …
3,选择分析变量,x,点击,dependent”
选择分组变量,c,点击,group”;
4,选择完毕后,点击,OK”。
线性相关和秩相关
采用编程的方法完成线性和秩相关分析:
可以用 corr过程完成
Proc corr data=data.d7_7 pearson spearman;
var x y;
Run;
结果:
Pearson Correlation Coefficients
/ Prob > |R| under Ho,Rho=0 / N = 10
X Y
X 1.00000 0.92391(相关系数 )
0.0 0.0001(检验结果 )
Y 0.92391 1.00000
0.0001 0.0
采用“分析员应用”可完成线性和秩相关分析:
1、分析员应用 — file— Open by SAS name;
2,Statistics— Descriptive— Correlations …
3,选择两个分析变量,x和 y,点击,Correlate”;
4,option— 选择 pearson,spearman和 P-value;
5,选择完毕后,点击,OK”。
采用“交互数据分析,只能完成线性相关:
1,交互数据分析 — 选择数据集;
2,Analyze— Multivariate(Y);
3,选择分析变量,X和 Y,点击,Y”;
4,output— 选择 corr和 corr p-value;
5,选择完毕,点击,OK”。
定性资料的统计描述
和假设检验
一、四格表资料的 χ2检验
采用编程的方法完成:
可以用 freq过程。
Proc freq data=data.d10_1;
weight f;
tables r﹡ c/chisq;
run;
一、四格表资料的 χ2检验
1| 2| Total
---------+--------+--------+
1 | 63 | 17 | 80
---------+--------+--------+
2 | 31 | 68 | 99
---------+--------+--------+
Total 94 85 179
一、四格表资料的 χ2检验
STATISTICS FOR TABLE OF R BY C
Statistic DF Value Prob
------------------------------------------------------
Chi-Square 1 39.927 0.001
Likelihood Ratio Chi-Square 1 41.860 0.001
Continuity Adj,Chi-Square 1 38.047 0.001
Mantel-Haenszel Chi-Square 1 39.704 0.001
Fisher's Exact Test (Left) 1.000
(Right) 1.44E-10
(2-Tail) 1.64E-10
一、四格表资料的 χ2检验
采用“分析员应用”完成
1、分析员应用 — 选择数据集;
2,Statistics— Table Analysis;
3,选择行变量,R,点击,Row”;
选择列变量,C,点击,Column”;
选择频数变量,F,点击,Cell Count”;
4,选择统计方法,Statistics— Chi-square statistics;
5、选择完毕,点击,OK”。
一、行×列表资料的 χ2检验
行×列表资料,无论是双向无序、单向有
序还是双向有序,它们的编程过程和菜单选择
都是一样的,只是在作结论时需选择不同的统
计量及其概率值。
一、行×列表资料的 χ2检验 -双向无序
采用编程的方法完成:可以用 freq过程。
Proc freq data=data.d10_3 order=data;
weight count;
tables illtype﹡ blood/cmh;
run;
一、行×列表资料的 χ2检验 -双向无序
Frequency|a |b |o |ab | Total
---------+--------+--------+--------+--------+
acut | 58 | 49 | 59 | 18 | 184
---------+--------+--------+--------+--------+
chro | 43 | 27 | 33 | 8 | 111
---------+--------+--------+--------+--------+
Total 101 76 92 26 295
一、行×列表资料的 χ2检验 -双向无序
SUMMARY STATISTICS FOR ILLTYPE BY BLOOD
Cochran-Mantel-Haenszel Statistics (Based on Table Scores)
Statistic Alternative Hypothesis DF Value Prob
------------------------------------------------------------
1 Nonzero Correlation 1 1.514 0.219
2 Row Mean Scores Differ 1 1.514 0.219
3 General Association 3 1.832 0.608
结论:血型与白血病种类无关。
一、行×列表资料的 χ2检验 -双向无序
采用“分析员应用”的方法完成:
1、分析员应用 — 选择数据集;
2,Statistics— Table Analysis;
3,选择行、列和频数变量(同四格表);
4,Input— order of appearance in data set;
5,选择统计方法,Statistics— Chi-square statistics;
6,选择完毕,点击,OK”。
二、行×列表资料的 χ2检验 -单向有序
SUMMARY STATISTICS FOR ILLTYPE BY BLOOD
Cochran-Mantel-Haenszel Statistics (Based on Table Scores)
Statistic Alternative Hypothesis DF Value Prob
------------------------------------------------------------
1 Nonzero Correlation 1 5.901 0.015
2 Row Mean Scores Differ 1 5.901 0.015
3 General Association 2 7.024 0.030
结论:副食品供给是否充足与营养状况是有关联。
二、行×列表资料的 χ2检验 -双向向有序
SUMMARY STATISTICS FOR ILLTYPE BY BLOOD
Cochran-Mantel-Haenszel Statistics (Based on Table Scores)
Statistic Alternative Hypothesis DF Value Prob
------------------------------------------------------------
1 Nonzero Correlation 1 7.307 0.007
2 Row Mean Scores Differ 2 8.914 0.012
3 General Association 4 9.512 0.049
结论:工人工龄与铅中毒的程度有关联。
完成统计描述的方法
1、运用编程的方法完成
2、用“交互数据分析”完成
3、用“分析员分析”完成
一、运用编程的方法完成
可以用 means 或 univariate过程。
proc means data=data.d3_1;
var x y z;
run;
proc univariate data=data.d3_1;
Run;
常用统计量的符号
N,例数 Mean,算术均数
Variance,方差 Std Dev,标准差
CV,变异系数
Std error 或 Std mean,标准误
Skewness,偏度系数
Kurtosis,峰度系数
正态性检验
proc univariate normal;run;
结果,W:Normal 0.932772
Pr<W 0.3843
结论:该组数据符合正态分布。
频数分布表数据的计算
data uni2;input x f @@;cards;
65 3 67 5 69 8 71 11 73 25 75 24
77 10 79 7 81 6 83 0 85 1;
proc univariate;var x;freq f;run;
几何均数的计算 (只能用编程计算 )
data logmean;input x f @@;y=log10(x);cards;
20 2 40 3 80 6 160 1 320 1;
proc means;freq f;var y;
output out=outmean mean=logmean;
data geomean;set outmean;g=10**logmean;
proc print data=geomean;var g;run;
结果:几何均数为 1, 64.6346
二、运用“交互数据分析”
1,Analyze — Distribution(Y)
2,在变量表中选择分析变量,再点 Y。
3,Output 选择分析项目。
( 1) Moment 描述性统计量
二、运用“交互数据分析”
( 2) Quantile 百分位数,中位数 (50% Med),四
分位间距 (Q3-Q1),极差 (Range),众数 (Mode);
( 3) Cumulative Distribution — Test
Distribution — normal 正态性检验;
结果,Kolmogorov D Prob > D
( 4) 95% C.I,For mean 均数的 95%可信区间
三、运用“分析员应用,
方法 1:
1,Statistics— Descriptive— Summary Statistics
2,在左侧框中选择分析变量,再点 Analysis
3,点击 Statistics,在需要计算的统计量前面的小框中
打勾,点击 OK返回。
4、点击 Output,选择字段宽度( Field width) 和有效
小数位数( Number of decimals)。
三、运用“分析员应用,
方法 2:
1,Statistics— Descriptive— distributions;
2,在左侧框中选择分析变量,再点 Analysis;
3,作正态性检验,fit— normal— OK;
4,完成选择后,点击 OK。
样本均数的比较
一、两组均数比较 —配对资料 t检验
采用编程的方法完成:
可以用 means 或 univariate过程。
proc means data=data.d4_1 t prt;
var d;run;
proc univariate data=data.d4_1;
Var d;run;
一、两组均数比较 —配对资料 t检验
结果:
Analysis Variable, D
Mean Std Error T( T值) Prob>|T|(P值 )
--------------------------------------------
-6.8000000 5.2042717 -1.3066189 0.2237
--------------------------------------------
一、两组均数比较 —配对资料 t检验
采用“交互数据分析,的方法完成:
1、交互数据分析 — 选择数据集;
2,Analyze— Distribution(Y);
3,选择分析变量 D,点击,y”;
4,output— location Tests,选择 student’s T Test
5,选择完毕后,点击,OK”。
一、两组均数比较 —配对资料 t检验
采用“分析员应用,的方法完成:
1、分析员应用 — file— Open by SAS name;
2,Statistics— Hypothesis Tests— two sample
Paired t-Test for mean …
3,选择两个分析变量,x1和 x2,分别点击,group 1”
和,group 2”;
5,选择完毕后,点击,OK”。
二,两组均数比较 —不配对资料 t检验
采用编程的方法完成:
可以用 ttest过程。
proc ttest data=data.d4_1;
class c;
var d;
run;
二,两组均数比较 —不配对资料 t检验
结果:
TTEST PROCEDURE
Variable,X 钩虫数量
C N Mean Std Dev Std Error
---------------------------------------------------
1 5 290.40000000 56.99385932 25.48842875
2 3 271.00000000 40.58324778 23.43074903
?
Variances T DF Prob>|T|
---------------------------------------
Unequal 0.5603 5.6 0.5971
Equal 0.5099 6.0 0.6284
For H0,Variances are equal,
F' = 1.97 DF = (4,2) Prob>F' = 0.7272
结果:
2
二,两组均数比较 —不配对资料 t检验
二,两组均数比较 —不配对资料 t检验
采用“分析员应用,的方法完成:
1、分析员应用 — file— Open by SAS name;
2,Statistics— Hypothesis Tests— two sample
t-Test for mean …
3,选择分析变量,x,点击,dependent”
选择分组变量,c,点击,group”;
4,选择完毕后,点击,OK”。
二,两组均数比较 —不配对资料 t检验
采用“分析员应用,的方法完成方差齐性检验:
1、分析员应用 — file— Open by SAS name;
2,Statistics— Hypothesis Tests— two sample
t-Test for variance …
3,选择分析变量,x,点击,dependent”
选择分组变量,c,点击,group”;
4,选择完毕后,点击,OK”。
线性相关和秩相关
采用编程的方法完成线性和秩相关分析:
可以用 corr过程完成
Proc corr data=data.d7_7 pearson spearman;
var x y;
Run;
结果:
Pearson Correlation Coefficients
/ Prob > |R| under Ho,Rho=0 / N = 10
X Y
X 1.00000 0.92391(相关系数 )
0.0 0.0001(检验结果 )
Y 0.92391 1.00000
0.0001 0.0
采用“分析员应用”可完成线性和秩相关分析:
1、分析员应用 — file— Open by SAS name;
2,Statistics— Descriptive— Correlations …
3,选择两个分析变量,x和 y,点击,Correlate”;
4,option— 选择 pearson,spearman和 P-value;
5,选择完毕后,点击,OK”。
采用“交互数据分析,只能完成线性相关:
1,交互数据分析 — 选择数据集;
2,Analyze— Multivariate(Y);
3,选择分析变量,X和 Y,点击,Y”;
4,output— 选择 corr和 corr p-value;
5,选择完毕,点击,OK”。
定性资料的统计描述
和假设检验
一、四格表资料的 χ2检验
采用编程的方法完成:
可以用 freq过程。
Proc freq data=data.d10_1;
weight f;
tables r﹡ c/chisq;
run;
一、四格表资料的 χ2检验
1| 2| Total
---------+--------+--------+
1 | 63 | 17 | 80
---------+--------+--------+
2 | 31 | 68 | 99
---------+--------+--------+
Total 94 85 179
一、四格表资料的 χ2检验
STATISTICS FOR TABLE OF R BY C
Statistic DF Value Prob
------------------------------------------------------
Chi-Square 1 39.927 0.001
Likelihood Ratio Chi-Square 1 41.860 0.001
Continuity Adj,Chi-Square 1 38.047 0.001
Mantel-Haenszel Chi-Square 1 39.704 0.001
Fisher's Exact Test (Left) 1.000
(Right) 1.44E-10
(2-Tail) 1.64E-10
一、四格表资料的 χ2检验
采用“分析员应用”完成
1、分析员应用 — 选择数据集;
2,Statistics— Table Analysis;
3,选择行变量,R,点击,Row”;
选择列变量,C,点击,Column”;
选择频数变量,F,点击,Cell Count”;
4,选择统计方法,Statistics— Chi-square statistics;
5、选择完毕,点击,OK”。
一、行×列表资料的 χ2检验
行×列表资料,无论是双向无序、单向有
序还是双向有序,它们的编程过程和菜单选择
都是一样的,只是在作结论时需选择不同的统
计量及其概率值。
一、行×列表资料的 χ2检验 -双向无序
采用编程的方法完成:可以用 freq过程。
Proc freq data=data.d10_3 order=data;
weight count;
tables illtype﹡ blood/cmh;
run;
一、行×列表资料的 χ2检验 -双向无序
Frequency|a |b |o |ab | Total
---------+--------+--------+--------+--------+
acut | 58 | 49 | 59 | 18 | 184
---------+--------+--------+--------+--------+
chro | 43 | 27 | 33 | 8 | 111
---------+--------+--------+--------+--------+
Total 101 76 92 26 295
一、行×列表资料的 χ2检验 -双向无序
SUMMARY STATISTICS FOR ILLTYPE BY BLOOD
Cochran-Mantel-Haenszel Statistics (Based on Table Scores)
Statistic Alternative Hypothesis DF Value Prob
------------------------------------------------------------
1 Nonzero Correlation 1 1.514 0.219
2 Row Mean Scores Differ 1 1.514 0.219
3 General Association 3 1.832 0.608
结论:血型与白血病种类无关。
一、行×列表资料的 χ2检验 -双向无序
采用“分析员应用”的方法完成:
1、分析员应用 — 选择数据集;
2,Statistics— Table Analysis;
3,选择行、列和频数变量(同四格表);
4,Input— order of appearance in data set;
5,选择统计方法,Statistics— Chi-square statistics;
6,选择完毕,点击,OK”。
二、行×列表资料的 χ2检验 -单向有序
SUMMARY STATISTICS FOR ILLTYPE BY BLOOD
Cochran-Mantel-Haenszel Statistics (Based on Table Scores)
Statistic Alternative Hypothesis DF Value Prob
------------------------------------------------------------
1 Nonzero Correlation 1 5.901 0.015
2 Row Mean Scores Differ 1 5.901 0.015
3 General Association 2 7.024 0.030
结论:副食品供给是否充足与营养状况是有关联。
二、行×列表资料的 χ2检验 -双向向有序
SUMMARY STATISTICS FOR ILLTYPE BY BLOOD
Cochran-Mantel-Haenszel Statistics (Based on Table Scores)
Statistic Alternative Hypothesis DF Value Prob
------------------------------------------------------------
1 Nonzero Correlation 1 7.307 0.007
2 Row Mean Scores Differ 2 8.914 0.012
3 General Association 4 9.512 0.049
结论:工人工龄与铅中毒的程度有关联。