试验统计 —— 以概率论为理论基础,
根据试验、调查、观测所得到的数据,
对研究对象的特征及内在规律进行估计与推断。
统计方法及其原理可以概括为:
由总体研究样本,由样本研究总体。
理论体系:总体如何! → 样本如何?
样本如何! → 总体如何?
样本如何!对样本作描述性统计。
SAS 过程为 UNIVARIATE。
data ex;input x @@;
cards;
70 72 94 24 68 57 90 185 95 93 109 64
58 79 40 118 84 70 99 132
154 100 77 34 68 26 48 87 85 95 123
105 107 55 45 73 109 58 101 134
94 94 62 156 61 84 77 123 135 40 107
79 131 72 66 30 44 141 98 100
90 78 44 50 58 60 76 78 92 101 62 152
97 81 54 98 75 118 130 90
115 136 100 80 69 98 84 25 179 97 76
56 73 43 22 82 60 68 160 139;
proc univariate vardef=n normal;run;
Moments
N 100 Sum Wgts 100
Mean 86.25 Sum 8625
Std Dev 34.0201 Variance 1157.368
Skewness 0.526515 Kurtosis 0.187048
USS 859643 CSS 115736.8
CV 39.4436 Std Mean 3.40201
T:Mean=0 25.35266 Pr>|T| 0.0001
Num ^= 0 100 Num > 0 100
M(Sign) 50 Pr>=|M| 0.0001
Sgn Rank 2525 Pr>=|S| 0.0001
W:Normal 0.965186 Pr<W 0.0605
大概率接受正态分布小概率拒绝正态分布
P E R C E N T
0
10
20
30
X M I D P O I N T
25 50 75 100 125 150 175
Quantiles(Def=5)
100% Max 185 99% 182
75% Q3 101 95% 153
50% Med 83 90% 134.5
25% Q1 62 10% 44
0% Min 22 5% 32
1% 23
Range 163
Q3-Q1 39
Mode 58
分位数中位数极差众数
Extremes
Lowest Obs Highest Obs
22( 95) 154( 21)
24( 4) 156( 44)
25( 88) 160( 99)
26( 26) 179( 89)
30( 56) 185( 8)
极端值
Stem Leaf # Boxplot
18 5 1 0
17 9 1 0
16 0 1 0
15 246 3 |
14 1 1 |
13 0124569 7 |
12 33 2 |
11 588 3 |
10 0001157799 10 +-----+
9 0002344455778889 16 | |
8 01244457 8 *--+--*
7 002233566778899 15 | |
6 00122468889 11 +-----+
5 04567888 8 |
4 0034458 7 |
3 04 2 |
2 2456 4 |
----+----+----+----+ Multiply Stem.Leaf by 10 **+1
75%分位数 101
50%分位数 83
25%分位数 62
本体箱图茎叶图 频数矩形框触须触须奇异值
>159.5?}
奇异值
1.5× (101-62)=58.5
101+58.5=159.5
Normal Probability Plot
185+ *
| * +
| * +++
| ***+++
| *+++
| ****+
| **+
| ++*
105+ +***
| *****
| ***
| *****
| ****
| ***+
| *****
| **++
25+* * **+
+----+----+----+----+----+----+----+----+----+----+
-2 -1 0 +1 +2
+为理论值
*为观测值若 *组成一线,
覆盖全部 +,
即是正态分布正态概率图