1
第十一章 描述统计
? 概率论是研究随机现象统计规律的学问,它为数理统计奠定了理论
基础。所谓数理统计,是以概率论为基础,通过合理地获取随机现
象的少量数据资料,估计和检验反映随机现象的某种数字特征,或
分析和判断随机现象所具有的统计规律性的学问。
? 数理统计的应用相当广泛,它已成为工业、农业、商业、医药卫生、
教育、社会学、经济学、生物学、气象学等各领域必不可少的数学
工具和分析方法,因此又被称为统计技术。
? 描述统计是通过图表或数学方法,对数据资料进行整理、分析,并
对数据的分布状态、数字特征和随机变量之间关系进行估计和描述
的方法。它是统计技术的重要组成部分,并在以后各章的统计推断
技术中被应用。
§ 11.1 数据的收集
§ 11.2 数字特征描述 (估计 )
§ 11.3 分布状态描述 —— 频数直方图
§ 11.4 排列图、因果分析图、趋势图
2
§ 11.1 数据的收集
科学研究中,若无定量分析,就不会有明确的
概念,也就不易找出科学的规律。质量管理如果不
进行定量分析,也就不会有明确的质量概念,就不
会有科学的质量管理。因此质量管理是一种以数据
为基础的活动。人们必须通过有目的的搜集数据,
从中获取有关产品质量或生产状态的正确情报,从
而做出正确的判断和决策,更有效地管理生产。
一 数据及其实质
二 总体、个体、样本、样品
三 数据收集的原则
四 数据的分类
3
一 数据及其实质
● 数据,在质量管理的各项活动中,记录有关科
学试验、质量特征、生产状态及管理现
状得到的数字资料统称为数据。
● 实质,收集的数据绝大多数都 既 具 有 随机性
(偶然性)又具有统计规律性。也就是
说它们具有随机现象的某些特征,或者
说是随机变量的一组取值。
4
二 总体、个体、样本、样品
1 总体与个体
定义,研究对象的全体,称为 总体 或 母体 ;组成总体的每个单元称为个体
● 研究对象的全体,指的是研究对象某 个数量 指 标 的 全部取值,由于一个
数量指标通常就是一个随机变量,因此,总体是指某随机变量的取值的全
体。而其中的每 个 值 都 是 一 个 个 体。例如,工厂生产一批晶体管,共
10000件。其直流放大系数是一个随机变量,10000件产品直流放大系数数
据的全体称为总体,而其中的一个数据则是一个个体。
● 如果要研究的不是一个,而是几个数量指标,如对一批晶体管不仅要研究
其直流放大系数,还有研 究 集电极 -发射电极反向电流时,则要分为几个
总体来研究。
● 总体的有限和无限 类 型 随 研究的问题而定,对于上述的一批晶体管而言,
总体是有限的;但有时根据研究的需要,我们常把相同条件下的生产的所
有晶体管看成一个总体,显然,此时,它是一个无限总体。
2 样本与样品
3 样本与总体
5
2 样本与样品
定义,从总体中随机抽取的若干个个体的总和称为
样本 或 子样 ;组成样本的每个个体称为 样品 ;
样本中所有的样品的数目称为 样本容量 或 子
样大小,样本容量常用符号 n代表
例, 从批量为 10,000的一批晶体管中随机抽取 20件
进行检查,被抽查的 20件产品称为样本,而其
中每一件产品称为样品;样本大小为 20。由
于人们通常只获得样本数据,故简称为数据
6
3 样本与总体
● 人们从总体中抽取样本的目的是根据样本数据对总体的数字特征和
分布规律进行推断、估计和检验。
● 自然,由样本推断和估计总体很难做到完全精确和可靠。但是必须
采取措施获得比较精确和具有一定可靠性的推断。其措施涉及两方
面的问题:即 抽取样本的方法和统计推断的方法 。
● 当样本的抽取满足下列两个条件时,样本将能很好地反映总体的统
计规律性:
( 1)样本容量 n足够大。样本容量越大,推断的结论越准确,可
靠性越高;
( 2)采用随机抽样,即总体中每个个体被抽到的机会均等,即使
一个个体被抽取后,总体的成分不变。换句话说,每个样品
的抽取都是一次独立、重复试验。
● 至于应采用的统计推断方法将在以后各章讨论
7
样本与总体的关系
个体具有随机性
总体具有统计规律性总体
样本
样本随机性
样本具有统计规律性
条件
抽样方法正确:① n足够大
②随机抽取
统计推断方法正确
结果,样本的统计规律性在一定程
度上反映总体的统计规律性


8
三 数据收集的原则
数据的收集是一项重要的基础工作,为了给质
量管理工作提供可靠的准确的情报,搜集数据
时,必须遵循以下原则
1 随机抽样
2 数据的分层
3 明确数据收集的目的和方法
4 作好数据记录,保证数据真实、可靠、准确
9
1 随机抽样
定义,是指从总体抽取样品时,使每个个体被抽到的机
会均等以使所抽取的样本数据能够很好地代表总
体的抽样方法。
方法,鉴于实际情况产品的大小、形状、存取状态等方
面的差异及条件限制,常用的随机抽样方法为:
( 1)简单随机抽样法,(单纯随机抽样)
① 抽签法(或掷骰子法)
② 随机数表法
( 2) 分层随机抽样
( 3) 系统随机抽样
( 4) 多级随机抽样
10
随机数表法
( 1) 定义,用随机数表查出样本号码的方法
( 2) 步骤,
● 随机决定所用数表页码( 瞎子点点法或掷骰子法)
● 决定起点(瞎子点点法)
● 查样本号数:
﹡ N≤10,查一位数字即可,取到 n个样品为止,重复的数字取消
﹡ 11≤n≤100,查两位数字,大于 n的以 n除之取余数,重复数字去掉
﹡ n> 100,向下取三位,大于 n的以 n除之取余数,重复数字去掉
( 3) 例,从批量 N =50的产品中抽 n = 4的样本采用掷骰子
采用掷骰子法确定选随机数表,I”;用瞎子点点法确定起点为 11

第 1 列,随机号码为 18,18,07,92,45,44… 取 18,7,42,45
11
分层随机抽样
15
60
75
1 6 0 0
800
150
?
?
???
C
B
A
n
n
n
● 定义,将总体按产品的某些特征把整批产品划分为若干层
(即小批),即分为层,同一层内的产品质量尽可
能均匀一致,在各层内分别用简单随机抽样法抽取
一定数量的个体组成一个样本的方法
● 分层按比例随机抽样,若按各层在整批中所占比例分别在
各层内抽取就称为分层按比例随机
抽样
● 例,某批产品批量为 N=1600,由 A,B,C三条生产线加工
而成,NA=800,NB=640,NC=160。取 n=150的样本。
解:
12
系统随机抽样法(间隔随机抽样)
● 定义,当批中产品可以按某个次序排列时,给批中
每个 产 品 编号 1~ N,以 整数部分 为
抽样间隔,用简单随机抽样法在 1至 之间
随机 抽 取 的 一个整数作为第一个单位产品
号码,每隔 个产品抽取一个,直到抽出
n个样本为止
● 例,某工序每天生产 200件产品,规定巡检员在一
天中抽取 n=10的样本进行检查,试用系统随机
抽样确定抽取的样本号码
解:,第一个样品号码用抽签法确定为 13,
则被抽取的样品号码为 13,33,53,…, 193
n
N ??????nN
??????nN
1???????nN
20??????? nN
13
多级随机抽样法
● 定义,整批产品由许多群组成,每群又分若干组组成 …,以
前三种方法任一种抽取一定数量的群,该群的单位产
品组成样本,称为整群抽样法或一级随机抽样法,若
在各群中按随机抽样法抽取若干组组成样本,称为二
阶段或二级随机抽样 …
● 例,某产品批 N=20000,分为 200箱,每箱 100个,分为 4盒,
每盒 25个,抽取 n=100的样本
解,﹡ 从 200箱中随机抽取 1箱,作为样本为整群随机抽样
﹡ 从 200箱中随机抽取 4箱,每箱中随机抽取 1盒作为样
本称为二级随机抽样
﹡ 从 200箱中随机抽取 10箱,每箱中随机抽取 2盒,每盒
中随机抽取 5个作为样本,称为三级随机抽样
14
2 数据的分层
● 定义,所谓数据的分层就是将收集来的样本数据根据不
同的使用目的和要求,按其性质、来源、影响因
素等对其进行分类的方法,它是分析产品质量问
题产生原因的有效方法。
● 注意事项,
( 1)数据的分层与数据收集目的紧密联系,目的不同,
分层的方法与粗细也不同
( 2)分层的粗细与对生产过程了解的程度有关
( 3)分层是一项细致的工作,分层不当,将会造成问题
原因不清的后果
● 分层原则,①操作人员 ②工艺装备 ③加工方法
④时间 ⑤材料 ⑥环境 ⑦其他
● 例 1
例 2
15
例 1
在磨床上加工某零件外圆,由甲乙两工人操作各磨 100个零
件,其产生废品 45件,试分析废品产生的原因。
甲 乙 合计
100 100 200
光洁度不合格 2 1 3
椭圆度超标准 1 2 3
锥 度 不 合 格 3 18 21
碰 伤 17 1 18
小 计 23 22 45
若只对工人,不对不合格原因进行分层:两工人的废品率相
差无几,找不出重点。若只对不合格原因,不对工人进行分
层:则会得到主要因素为锥度不合格、碰伤两原因。对工人
及不合格原因分层后:甲工人主要因素为碰伤;乙工人主要
因素为锥度不合格
16
例 2
在某产品装配过程中,经常发现齿轮箱盖漏油的现象,为解决该问题,
对该工艺进行了现场调查,收集数据 n=50;漏油数 f=19;试用分层法找
出影响产品质量的原因
1 通过分析:造成漏油的原因有两个
( 1)齿轮箱密封垫是由甲、乙两厂分别供给的
( 2)涂粘结剂的工人 A,B,C操作方法不同
2 为分析问题原因,采用分层法分别对 操作者和齿轮箱垫供货单位分层
3 措施:采用乙厂的齿轮箱垫,工人 B的操作方法
4 效果:漏油率不但未降低,反而增加了
5 再次分析原因:只是单纯地分别考虑不同工人,不同供应厂造成的漏
油情况,而没有进一步考虑不同工人用不同供应厂提供的齿轮箱垫造
成的漏油情况,即由于没进行更细致的综合分析造成的。作 综合分层
结论:使用甲厂齿轮箱垫时 B的操作方法好
使用乙厂的齿轮箱垫时 A的操作方法好
采用措施后漏油率大大降低
17
操作者分层表
工人 漏油 不漏油 漏油率( %)
A 6 13 32
B 3 9 25
C 10 9 53
合计 19 31 38
供货厂 漏油 不漏油 漏油率( %)
甲 11 14 44
乙 8 17 32
合计 19 31 38
齿轮箱垫供货单位分层表
18
综合分层表
齿轮箱垫 计
甲 乙
A 漏 6 0 6不漏 2 11 13
B 漏 0 3 3不漏 5 4 9
C 漏 5 5 10不漏 7 2 9

漏 11 8 19
不漏 14 17 31
合计 25 25 50
供货厂
操作者
19
3 明确数据收集的目的及方法
● 目的通常有下列几种:
( 1)为掌握生产现状收集数据
( 2)为分析问题收集数据
( 3)为判定产品质量合格与否收集数据
( 4)为控制生产状态收集数据
( 5)为掌握与调节工艺状态收集数据
● 目的不同,收集的方法(数量、时间、地点、
取样方式、测试方法、精确度以及定性质量指
标数量化的方法及标准等)不同
20
4 作好数据记录,保证数据真实、可信、准确
( 1)为避免数据遗漏,在收集的同时进行数据整理和简单的
分层,应尽量使用预先设计的数据记录表格 ——调查表
● 调查表是为了掌握生产和试验现场情况,根据分层的思
想设计出的数据及不合格记录表格。是收集数据并对数
据进行粗略整理的有效工具。
● 根据使用目的,使用场合,使用对象以及使用范围不同,
调查表的形式,内容也多种多样,在实际中可以灵活设
计和应用
( 2)注意记录与数据有关的数据背景,如测试时间、地点、
数量、测试者、零件号、批号、名称规格及必要的环境
条件等。
有利于分析问题,且可以避免不同条件的数据混淆
( 3)数据必须真实、可靠、准确
21
不良项目调查表
铸件缺陷原始记录表
零件名称:盖子 零件图号,日期:
单位,×× 车间 ×× 工段 操作者,填号人:
检查记录 小计
Ⅰ Ⅱ Ⅲ Ⅳ
欠铸 正正正 正 正一 29
缩裂 正 一 10
气孔 正正正 正 20
夹渣 一 一 5
折叠 T 一 3
其他 T 2
合计 38 9 8 14 69
部位缺
陷项目
22
缺陷位置调查表
机翼划伤位置记录表
单位,× 车间 × 工段 日期,年 月 日
操作者,× × × 填号者,× × ×
×,严重划伤
×,轻划伤
0,压坑
× ×
×
23
四 数据的分类
不同的样本数据来源于不同的总体,即是不同的随机变量的一组(某些)
取值,不同的随机变量有不同的统计规律。因此在进行数据分析前必须
分清数据的类型
1 计量值数据,可以连续数值的数据
如长度、温度、硬度、强度、化学成分、时间
它是连续型随机变量的一组取值具有连续型随机变量的
分布特征
2 计数值数据,是对单位产品或产品上的缺陷进行检查时得到正整数数
据如不合格品数、出勤人员、疵点数等
注意:表示百分率的数据(如出勤率、不合格品率、退修率等)其类
型取决于其分子数据的类型
分类, ( 1)计件值数据:对产品 按件检查时得到的数据(如批产品
中的不合格品数)
( 2)计点值数据:检查 单件产品上质量缺陷时得到的数据如
单位棉织品上的 疵点数、铸件上的砂眼数、收音机底版
焊点数等)
3 顺序值数据,为了把定性指标定量化,按某种标准进行评分以比较优
势程序,确定评定等级或类别得到的数据
24
§ 11.2 数字特征描述 (估计 )
一 统计量
二 样本平均值
三 众数
四 中位数
五 极差
六 样本方差
七 样本均方差
25
一 统计量
? 描述样本数据统计性质的度量值称为统计特征
量,简称统计量。统计量是随机变量 X数字特征
的估计值
? 统计量的数值大小是由收集的样本数据决定的,
统计量是样本数据的函数,但其中不包含未知
的参数。如果说,在一个函数中,既包括样本
数据,又有未知参数,那么这个函数就不能称
? 鉴于样本抽取的随机性,作为样本的函数,统
计量也是一个随机变量。统计量的分布是由 X
的分布决定的
? 常用统计量有样本平均值,中位数,众数、
极差 R、方差 S2、均方差 S等x x~
26
二 样本平均值
1 概念
从总体中随机抽取大小为 n的样本,其数据分别为 x1,x2,…
xn,则其样本平均 值记为
样本平均值 是总体 X数学期望 μ的估计值
若样本数据的种类数为 k,第 j种数据的数值为 xj; xj出现的频
数为 fj;此时可用下式计算:
例 1
2 性质
?
?
?? k
j
jj xfnx
1
1??
27
例 1
从某工序加工的一批零件中随机抽取样本大小为 12的
数据。其尺寸分别为,25.5,25.8,25.9,25.7,
25.8,
25.6,25.9,25.8,25.8,25.6,25.9,25.8。试估计

批零件的均值。
解:或
76.25)39.2526.2515.25(12 1? ????????? ?x?
28
2 性质
● 是一个随机变量,若总体的数学期望为 μ,方差为 σ2,则随
机变量 的数学期望和方差分别为:
可以看出,n越大,
● 例 2 从一批产品中随机抽取 5件测量其尺寸,得数据如下:
14.5,
14.0,13.2,13.5,14.8。设母体的均方差 σ=1,试求尺寸的

值及平均尺寸的方差。
● 样本平均值是描述随机变量集中位置特征的最常用的量,通常
x
x
x
29
三 众数
? 概念,在样本数据中,出现频数最多或频
率最大的数据称为众数。它也是描述数
据集中位置的统 计量。
? 使用条件,只有当数据个数较多而且有
明显的集中趋势时,才能计算众数。
? 例 3:试求例 1中样本数据的众数
解:由 例 1表,显然,样本数据的众数为
25.8。
30
四 中位数
● 概念,将样本数据按大小顺序排列,若样本大小 n为奇数,
排在正中央的数据为中位数;若样本 大小为偶数,排在
中央的两个数据的算术平均值为中位数。中位数用 表
● 例 4 试找出 3,5,6,7,11五个样本数据和 3,5,6,8、
9,11六个样本数据的中
解,3,5,6,7,11的中位数为 6
3,5,6,8,9,11的中位数为
● 当总体为连续型随机变量且概率密度曲线为对称时 (如正
态分布 ),常用中位数估计总体均 值 μ
据的影响。
● 正态总体 的样本中位数 渐进为,
因此正态总体用 估计 μ
x~
x~
x~
)2,( 2??? nN),( 2??N
31
五 极差
? 概念,将样本数据按大小顺序排列,数列中最大
值 max(xi)与最小数据 min(xi)之差 称为样本的极
差。记为 R。
? 例 5 如例 4中,两组数据的极差均为
R=11-3=8。
? 作用,样本极差是描述总体离散程度的数量值。
? 在正态总体标准差估计场合
当 n>10时,将数据分组求极差均值。
nd
R???
2
111 ?? n
nd n
102 ?? n
32
六 样本方差
● 概念, 设 样本数据 x1,x2,…,xn为来自总体 X的样

数据。若总体的数学期望 μ已知,则样本方
差 S2的计算公式为
若总体的数学期望 μ未知,则样本方差 S2的
计算公式为:
样本方差是总体 X方差 D(X),即 σ2(X)的估计值
● 常用计算公式
● 例
33
常用计算公式
在实际问题中,经常碰到的是数学期望 μ未知的情况。即:
在现场中,为计算方便,在 n较大时,有时使用下式代替进行
在实际计算中,常用化简整理后的下式进行计算。
若样本数据的种类数为 k,第 j种数据的数值为 xj,xj出现的频
数为 fj,此时,S2
34
例 6
计算例 1所给样本数据的方差


0 1 7.0]76.251280.2580.2550.25[112 1? 22222 12 ????????? ? ?nS?
0 1 7.0)76.2512390.25260.25150.25(112 1? 22222 12 ???????????? ? ?nS?
])76.2580.25()76.2580.25()76.2550.25[(112 1? 2222 12 ????????? ? ?nS?
017.0?
35
七 样本均方差
● 概念,总体 X的均方差 为方差 D( X) (σ2( X) )的正平方根,

因此有:
)()( XDX ??
?
?
?
?
?
?
???
?
?
???
n
i
ii
n
i
i
nxx
n
SSX
xx
n
SSX
1
222
1
22
)(
1
1
)(?
)(
1
1
)(?
?
?
?
?
?
??
?
?
n
i
n
i
i
i n
x
x
n 1
1
2
2 ]
)(
[
1
1
?
?
?????
k
j
jj xxfnSSX
1
22 )(
1
1)(??
?
?
?
?
??
?
??
?
?
k
j
k
j
jj
jjjj n
xf
xf
n
xnxf
n 1
1
2
222 ]
)(
[
1
1)(
1
1
● 例 7 试计算例 6中样本数据的均方差
● 样本均方差是总体均方差的估计值
13.0017.0? ??? S?
)(x?
36
§ 11.3分布状态描述 —— 频数直方图
一 概念,频数直方 图是通过对随机收集的样本数据
进行分组整理,并用图形描述总体分布状
态的一种常用工具
二 绘制程序
三 频数直方图、频率直方图、频率密度直方图和频
率密度曲线
四 频数直方图的应用
37
二 绘制程序
? 例 8 从一批螺栓中随机抽取 100件测量其外径
数据如下表所示。螺栓外径规格为 。试
绘出频数直方图。
? 绘制程序
7.938
7.930
7.938
7.914
7.924
7.929
7.928
7.920
7.918
7.923
7.930
7.925
7.930
7.930
7.925
7.918
7.920
7.918
7.928
7.928
7.918
7.913
7.925
7.926
7.928
7.924
7.922
7.923
7.915
7.919
7.925
7.925
7.925
7.925
7.927
7.920
7.922
7.927
7.923
7.925
7.923
7.927
7.927
7.927
7.923
7.922
7.923
7.929
7.931
7.922
7.930
7.920
7.924
7.925
7.929
7.922
7.925
7.930
7.926
7.918
7.920
7.925
7.930
7.926
7.923
7.920
7.929
7.930
7.925
7.922
7.929
7.928
7.930
7.935
7.930
7.939
7.925
7.924
7.930
7.935
7.922
7.918
7.922
7.925
7.925
7.920
7.927
7.922
7.930
7.930
7.925
7.938
7.922
7.915
7.918
7.927
7.935
7.931
7.919
7.922
05.0 10.08???
单位,mm
38
绘制程序
1 收集数据,并找出数据中最大值 xL和最小值 xS
数据个数应 ≥50,并将数据排成矩阵形式。本例数据
个数 n=100。最大值 xL=7.938,最小值 xS=7.913
2 计算极差
3 确定分组组数 k
k值的选择一般参考下表给出的经验数值确定
本例选择 k=10
4 确定组距 h
5 计算各组的上、下边界值
6 计算各组的组中值 xi
7 统计落入各组的数据个数,整理成频数表
8 作直方图
n K
50-100 6-10
100-250 7-12
250以上 10-20
0 2 5.09 1 3.79 3 8.7 ????? SL xxR
数据分组组数表
39
4 确定组距 h
? 组距即每个小组的宽度,或组与组之间的间隔
? 本例中
? 为分组方便,常在 h的计算值基础上将其修约为
测量单位的整数倍,并作适当调整。 如本例测
量单位为 0.001,将 h修约为 0.003
k
R
k
xxh SL ???
0 0 3.00 0 2 5.0100 2 5.0 ???h
40
5 计算各组的上、下边界值
? 为了不使数据漏掉,应尽可能使边界值最末一位为测量单位的 1/2。
? 当 h为奇数时,第一组边界值应为
? 当 h
第一组上边界值 =xS – 测量单位 /2
第一组下边界值 =上边界值 +h
一直计算到最末一组将 xL包括进去为止。
? 本例 h为奇数,故第一组上下边界值为
? 其余各组的上下边界值为:
某组上边界值 =
某组下边界值 =该组上边界值 +h
本例第二组上下边界值为 7.9175~ 7.9145;第三组为 7.9175~ 7.9205……
依次类推,最后 一组为 7.9385,包括了最大值 7.938(见频数表 )
2hxS ?
9 1 1 5.70 0 1 5.09 1 3.72 ???? hx S ~ 7.9145
41
6 计算各组的组中值 xi
2
组下边界值第组上边界值第 iix
i
??
如本例
9 1 6 0.7
2
9 1 7 5.79 1 4 5.7
9 1 3 0.7
2
9 1 4 5.79 1 1 5.7
2
1
?
?
?
?
?
?
x
x
42
7 统计落入各组的数据个数,整理成频数表
组号 i 组边界值 组中值 xi 频数统计 fi
1 7.9115 ~ 7.9145 7.913 2
2 7.9145 ~ 7.9175 7.916 2
3 7.9175 ~ 7.9205 7.919 正 正 正 一 16
4 7.9205 ~ 7.9235 7.922 正 正 正 18
5 7.9235 ~ 7.9265 7.925 正 正 正 正 23
6 7.9265 ~ 7.9295 7.928 正 正 正 17
7 7.9295 ~ 7.9325 7.931 正 正 正 15
8 7.9325 ~ 7.9355 7.934 3
9 7.9355 ~ 7.9385 7.937 4
43
8 作直方图
以频数为纵坐标,质量特性为横坐标画出坐标
系,以一系列直方形画出各组频数,并在图中
标出规格界限和数据简 历,组成频数直方图
规格要求


7.937
43
1517
23
1816
2
25
20
15
10
5
0
2
7.934
7.931
7.928
7.925
7.922
7.919
7.9167.9
7.913
7.95
n=100 96.5.7~ 96.5.15
3#件 S=0.00519
2号机床 X=7.92524
x
f
44
三 频数直方图、频率直方图、频率密
度直方图和频率密度曲线
? 频数直方图
以样本数据表征的质量特性值为横坐标,以频数为纵坐标 作出的
? 频率直方图
将频数直方图的纵坐标改为频率做出的频率直方图,其形状与 频
数直方图应完全一样
? 频率直方图
若将纵坐标改为频率密度,横坐标不变,直方图的形状也不变。
? 频率密度曲线
当样本数据的大小 n→∞,组距 h→0时,直方的数量将趋于 ∞;随机
变量 (即质量特征 )在 某 区间 h的频率密度将趋于概率密度;直方
顶端联成的折线将形成一条光滑的曲线 ——概率密 度曲线
2 区别与联系
3 正态分布及其频数直方图的特征
1 频数直方图、频率直方图、频率密度直方图和频率密度曲线图形演变
45
2 区别与联系
频数直方图、频率直方图、频率密度直方图与概率
密度曲线,虽然它们的坐标不同,描述 分布状态的
方式有的是折线、有的是曲线,但其大致形状是相似
的。概率密度曲线表明了总 体的分布状态;而频数
直方图等是对总体分布状态的描述
3 正态分布及其频数直方图的特征
? 实践和理论证明:当一个连 续型随机变量受到许多
相互独立的随机因素的影响时,如果这许多因素的影
响虽然有的大一 些,有的小一些,但每一个因素在
影响的总和中都不起主导作用时,这个随机变量将服
从正
? 许多产品的计量质量指标,如强度、长度、寿命、
测量误差等在生产条件稳定、正常的前 提下,均服
从正态分布。因此,测量这些指标得到的数据,其频
数直方图的形状应具有正态 分布概率密度曲线的特
征 ——为中间高、两边低、左右大致对称的山峰型。
46

1 观察工序状态
( 1) 原理
如上所述,大部分计量指标服从正态分布,即在稳定正常生产
状态下得到的数据,其频数 直方图的形状是, 中间高、两边低、
左右对称的山峰型,,我们称这种形状的直方图为 正常 型直方图
当影响产品质量特性的因素中,有的因素在影响的总和中占据了
主导地位,成为, 异常 因素, 时,质量特性的正态分布状态将被打
破,频数直方图的形状将出现异常型。此时,现 场人员应根据直
方图形状迅速分析判断异常原因,采取措施,使工序恢复正常状态
( 2)几种常见的 异常型频数直方图
2 与规格比较,明确改进方向
( 1)原理:在直方图上标明规格上限及下限,可直观地将直方图的位置、
分散范围与规格比较,从而分析质量状况,明确改进方向
( 2) 与规格比较的几种情况
3 不合格品率估计
47
a.正常型 b.孤岛型
c.偏向型 d.双峰型
e.平顶型 g.陡壁型f.折齿型
规格范围
48
(2)几种常见的异常型频数直方图
● 孤岛型 在直方图旁边有孤立的小岛出现。其原因是在加工和测
量过程中有异常情况出现。如原材 料的突然变化,刃具的严重磨
损,测量仪器的系统偏差,不熟练工人的临时替班等。
● 偏向型 偏向型也称偏峰型。即直方的高峰偏向一边。这常常是
由于某些加工习惯造成的。如加工 孔时,有意识地使孔的尺寸偏
下限,其直方图的峰则偏左;当加工孔时,有意识 地使轴的尺寸
● 双峰型 直方图出现了两个高峰。这往往是由于将不同加工者、
不同机床、不同操作方法等加工 的产品混在一起造成的。因此,
● 平顶型 平顶型即直方图的峰顶过宽过平。这往往是由于生产过
程中某种因素在缓慢的起作用造成 的。如刃具的磨损、操作者逐
● 折齿型 测量误差太大或分组组数不当都会使直方图出现凸凹不
平的折齿形状。
● 陡壁型 直方图在某一侧出现了高山上陡壁的形状。这往往是在
生产中通过检查,剔除了不合格品后 的数据作出的直方图形状。
49
产品分布范围
规格范围
产品分布范围
规格范围
产品分布范围
规格范围
产品分布范围
规格范围
产品分布范围
规格范围
最理想的直方图 直方图的分布范围仍在规格范围内,但中心偏向一侧。 此时,
已存在出现不 合格品的潜在危
险,应立即采取措施,将分布
中心调至规格中心
直方图的分布范围已充满整
个规格界限。此时,存在更
多出现不合格品的潜 在危险,
必须立即采取措施,减小分
散。
直方图的分布范围已超出现规格界限,并
已出现一定数量的不合格品。应立 即采
取措施,减小分散;对产品 实施全数检
查;或适当放宽规格界限,以减小损失
分布非常集中。在此情况下,应充
分考虑经济效果,采取适当放宽工
艺 条件或加严规格要求等措施。
50
3
( 1) 计算平均值与标准偏差
● 直接用样本数据进行计算
以各组组中值代表各组数据进行计算
本例中:
● 简易求法
( 2) 不合格品率估计
n
x
x
n
i
i?
??? 1???
?
????
n
i
i xxnS
1
2)(
1
1??
?
?
??
k
j
jj xfnx
1
1?? ? ?
? ?
????
k
j
k
j
jjjj xfnxfnS
1 1
22 ])(1[
1
1??
0052.0)4937.72913.7(
100
1)4937.72916.72913.7(
1100
1?
9252.7)4937.72916.72913.7(
100
1?
222 ????????????
?
??
?????????
??
?
S
x
?
?
51
平均值及标准偏差简易求法
● 以各组组中值代表组中各数据进行计算;
● 将 x坐标变换为 u
令近于中间、频数较多的一级组中值为 x0,并令该组 u坐
标值 uj=0;其它各组按下列 变换式进行变换
变换结果为:自 uj=0向下的各组,u值分别为 1,2,3,… ;
向上的各组,u值为 -1,- 2,-3,… 。作 直方图计算表
● 计算
● 按下式计算
h
xxu j
j
0??
? ? ;;; 22 jjjjjjjj fufufufu 及
0 5 2 2.0)
1 0 0
8
3 0 0(
11 0 0
1
0 0 3.0?
9 2 5 2.70 0 3.0
1 0 0
8
9 2 5.7?
]
)(
[
1
1
?
?
2
2
2
0
??
?
??
?????
?
?
??
????
?
?
?
S
x
n
fu
fu
n
hS
h
n
fu
xx
jj
jj
jj
?
?
?
?
本例
52
直方图计算表
组中值 xj uj fj ujfj uj2fj
1 7.913 -4 2 -8 32
2 7.916 -3 2 -6 18
3 7.919 -2 16 -32 64
4 7.922 -1 18 -18 18
5 7.925=x0 0 23 0 0
6 7.928 1 17 17 17
7 7.931 2 15 30 60
8 7.934 3 3 9 27
9 7.937 4 4 16 64
∑ 0 100 8 300
53
( 2)估计不合格品率
? 当 以及规格界限均已知时,则可
借助正态分布表估计不合格品率
? 如本例中,;规格界限

(7.90~ 7.95)。不良品率 p的估计

05.0 10.08???
0)01(1
)]85.4()77.4([1
)]
0 0 5 2.0
9 2 5 2.790.7
()
0 0 5 2.0
9 2 5 2.795.7
([1
????
??????
?
??
?
???p?
p?
0052.0?;9252.7? ?? ??
?? ??、
54
§ 11.4 排列图、因果分析图、趋势图
? 在质量管理中,人们将会收集大量的文字信息和数学
信息。对信息的整理和对事物的描述方 法不同,其效
果也不同。而采用图或表进行信息整理和事物的描述
无疑是最好的方法。它具 有主题明确、层次清楚、关
联性易于表达、信息量大、善于启发思维,迅速分析
问题作出决
? 频数直方图是一种常用的描述分布的图表法,除此之
外,还有各种各样整理和描述信息的方 法。本节将介
绍常用的排列图、因果分析图、趋势图。描述变量之
间关系的相关图将在后面介绍。
一 排列图
二 因果分析图
三 趋势图
55
一 排列图
排列图又称巴雷特图或主次因素分析图
1 (Pareto) 于
20世纪初创立的。他发现运用排列图,可 以找出, 关键的少
数和次要的多数, 的关系。后来,美国质量管理专家朱兰
(J·M·Juran) 把该原理应用于质量管理工作中。在质量分析时
发现,尽管影响产品质量最关键的往往只是少数几项,而由
它们造成的不合格产品却占总数的绝大部分。就是根据这个
,关键少数,次要多数, 的原理,使排列图在质量管理中,成
为查找影响产品质量关键因素的重要工具。
2 用途:因素影响的主次位置,可从 排列图上一目了然。从而
明确改进方向和改进措施。采取措施后的效果,还可用排列
图进行对比确认。排列图不仅可用于质量管理,还广泛地应
用于其它领域。
3 绘制程序
4 应用注意事项
56
排列图的结构
20
40
100
80
60
120
140
160
0 0
25
50
75
100
( 90)
( 80)BA
C
D E F G H I
频数
累计频率
×
100
3 绘制程序
( 1)结构
( 2) 绘制步骤

57
( 2) 绘制步骤
?
? 收集数据,对数据进行整理,列出分类统计表。
? 按一定的比例分别画出两个纵坐标,表示频数和累积频率。
? 将横座标划分若干等分表示各影响因素。并按影响程度的大小,
从左向右依次画 出直方形。
? 找出每个影响因素所对应的累计百分数点,并连接起来成为一
条由左向右逐渐上升的曲 线,即巴雷特曲线。
在排列图上,常将曲线的累计百分数分三级,并相应的将因素
分为三类。
A类因素:累积频率为 0—80%,该区间的因素是主要影响因

B类因素:累积频率为 80%—90%,该区间的因素是次要影响
因素。
C类因素:累积频率为 90%—100%,该区间的因素是一般因

? 注明数据收集的背景。
58

某厂对活塞环槽侧壁不合格的 275件产品进行缺陷分类
统计,其结果是:精磨外圆 不合格 229件,精镗销孔
不合格 56件,磨偏差不合格 14件,精切环槽不合格
136件,垂直摆差 不合格 42件,斜油孔不合格 15件,
其它不合格 8
? 缺陷按其数量自大至小进行排列,并计算出累计频数
和累计频率作出 缺陷分类统计表
? 作 排列图
? 因素分类,精磨外圆和精切环槽是主要因素,解决 了
这两个主要问题,将显著降低不合格品率;精镗销孔
为次要缺陷;其它缺陷为一般缺陷。 解决问题应从主
59
活塞环槽侧壁加工缺陷分类统计表
序号 缺陷 频率 累计频数 频率 × 100 累击频率 × 100
1
2
3
4
5
6
7
精磨外圆
精切环槽
精镗销孔
垂直摆差
斜 油 孔
磨 偏 差
其 它
229
136
56
42
15
14
8
229
365
421
463
478
492
500
45.8
27.2
11.2
8.4
3.0
2.8
1.6
45.8
73.0
84.2
92.6
95.6
98.4
100.0
总计 500
60
活塞环槽缺陷排列图
20
40
100
80
60
0
50
10
30
70
90
500
400
300
100
200
56 42
15 14 8
229
136
N=500
45.8
频数
























61
4 应用注意事项
(1)一般来说,主要因素应只是一、二个,至多不超过三个,
否则就失去找主要因素的意义。 当出现主要因素过多时,
要重新考虑因素的分类。
(2)必要时,频数可用金额来表示,以找出真正重要的经济
(3)在采取措施的后,还应作排列图,以进行效果检查对比。
(4)收集数据的时间一般为 1~ 3个月比较合适,时间太长,
生产过程往往会有较大的变动,影响数据的可比性。时
(5)不太重要的项目很多时,横坐标会变得很长,通常把这
些列入, 其他, 项,排在最后。
62
二 因果分析图
1 概念:因果分析图 又称特性要因图、鱼刺图、树图等。它是用来分析、
整理影响产品质量的各种因素及其之 间关系的图式。是寻找产生
质量问题原因的简便而有效的方法。其 结构如图
2 绘制程序
(1)明确质量问题
(2)调查研究
(3)

3 应用注意事项
(1)充分发扬民主,使所有参加人员充分发表意见、畅所欲言,防止技术
权威, 一言堂, ;
(2)
(3)
(4)对关键原因可再进一步进行因果分析,并进行重点考察,制定解决措
(5)
63
因果分析图结构




材料
环境测量方法
人员设备
主干线
更小原因
中原因
64














未按中间尺寸对刀
方法材料机床
床温不够
环境 操作者
量值传递标准不一致
无温差修正标准
责任心差
室外气温影响
自然时效不好
停车时间长
预热时间短
刀头未压紧
未按工艺执行未定时检测
早晚温差大寒流
暖气不正常
室内温差大
两台量仪量
值不一致
未在标温下
鉴定环规
人工时效不好
炉温低
毛胚变形
时间短
活塞销孔孔径尺寸超差因果分析图
65
三 趋势图
1 概念,趋势图又称波动图,工序能力图。它是观察质量
特性值随时间的推移发生的变动趋势的图表 。运用它,
可以及早发现工序的异常状态,预防不合格品的产生。
2 绘制程序
(1)作以质量特性值为纵坐标、以时间顺序排列的样品
号码为横坐标的坐标系,并将规格上 限 TU、规格下
限 TL和规格中心 Tm
(2)按横坐标给定的时刻或规定的时间间隔抽取样品,
(3)将点连接成波动曲线,将曲线与规格界限进行比较,
判断工序是否稳定。

3 分析与判断
4 评价
66

某零件尺寸规格为,其尺寸趋势图
如下:
010.0 002.031 ???
质量特性值
/m
m +0.010
+0.008
+0.006
+0.004
+0.002
5 10 15
TU
TL
Tm
时间(或
样品号)
67
3分析与判断
(1)所有点子均在规格界限内,且点子的排列无异常现
象 (见图 1)。这说明工序处于稳定
(2)曲线波动大,个别点超出规格界限 (见图 2)。这说明
工序散布太大,并已产生不合格 品,应立即停止生
产,查找原因,采取措施,减小工序散差。
(3)曲线波动不大,但靠近一侧规格界限 (图 3)。说明质
量特性均值与规格中心 Tm 不一致,须进行调整,使
(4)曲线的排列出现明显的变化趋势。如若干点连续上
升或下降 (图 4、图 5),或曲 线发生明显的周期性波
动 (图 6)等。说明工序分布正在发生某种变化,应立
即查找原因,采取措施使工序恢复稳定状态。
68
时间
TU
TL
Tm
时间
TU
TL
Tm
时间
TU
TL
Tm
时间
TU
TL
Tm
时间
TU
TL
Tm
时间
TU
TL
Tm
图 1 工序稳定状态趋势图 图 2工序散差过大趋势图
图 5 工序呈下降趋势的趋势图 图 6 工序呈周期性变动趋势图
图 3 工序分布中心偏离规格中心趋势图 图 4 工序呈上升趋势的趋势图
69
4 评价
? 趋势图具有简单、方便、直观、现场工
人易于掌握等优点。但对比统计过程控
制,尚缺乏科学性和分析、判断的准确
性。因此,当条件具备时,应尽可能采
用控制图对工序进行统计过程控制。