统计质量控制理论和方法涂火年 广西财经学院第一章 数据整理及其图示
1.1质量特性及其数据整理
一、数据的种类
1.计量值数据
(长度、重量、电流、温度等。测量结果的数据可以是连续的,
质量特性不能连续取值的,只能以个数计算的数为计数值数据。(不合格品数、缺陷数)
质量特性的分布单个产品质量特性是随机的,但是一批产品的质量特性却是呈现某种规律性。
数据整理方法及图示
计量数据的分组统计与直方图
1,频数频率分布表
① 寻找组数据极差,一组测量数据中的最大值和最小值之差,通常用于表示不分组数据的离散度,用符号 R表示:
m i nm a x xxR
二、总体和样本
把所研究的对象的全体称为全及总体,也叫做母体或简称为总体 。
通常全及总体的单位数用 N来表示,样本单位数称为样本容量,用 n来表示 。 相对于 N来说,
n则是个很小的数 。 它可以是总体的几十分之一乃至几万分之一 。
我们抽取的样本后获得的质量特性的值记为称为样本观察值 。n,x,2,x1x L
② 根据样本的容量 n决定分组数 k和每组的组距 d,关于组数 k有一个推荐使用的公式:
K=1+3.322lg(n)
注:这个公式不是绝对的,选择的原则是要能反映数据中所隐藏的规律,组数不能过多也不能过少。
2,直方图直方图法是适用于对大量计量值数据进行整理加工,找出其统计规律,即分析数据分布的形态,以便对其总体的分布特征进行推断,对工序或批量产品的质量水平及其均匀程度进行分析的方法。
三、数据特征值
数据特征值是数据分布趋势的一种度量。
数据特征值可以分为两类。
集中度,平均值、中位数、众数等;
离散度,极差、平均偏差、均方根偏差、标准偏差等。
1.表示数据集中趋势的特征值
(1)频数
计算各个值反复出现的次数,称之为频数。
(2)
如果产品质量有 n个测量数据 xi(i=1,2,…,n),平均值为:
如果测量数据按大小分组,则平均值为
n
i
ixnx
1
1
n
i
ii xfnx
1
1
(3)
数据按大小顺序排列,排在中间的那个数称为中位数 。 用 表示 。 当数据总数为奇数时,最中间的数就是;当数据总数为偶数时,中位数为中间两个数据的平均值 。
(4)众数
众数是一组测量数据中出现次数 (频数 )最多的那个数值,一般用 M0表示 。
x~
2.
(1) 极差极差是一组测量数据中的最大值和最小值之差 。 通常用于表示不分组数据的离散度,用符号 R表示 。
m i nm a x xxR
(2) 平均偏差将每个数据减去平均值,并把它们的差值的绝对值相加再除以测量数据的总个数,即得到平均偏差,用 AD表示。
n
i
iiD xxFnA
1
1
(3)均方根偏差
均方根偏差是测量数据平均值之差的平方和被总测数平均,然后再求其平均值,用 σ表示。
用均方根偏差作为的度量,可以直接比较两组数据的均方根偏差的大小就可看出两组数据离散程度的大小。
2
1
1?
n
i
ii xxFn?
(4)标准偏差
测量数据分布的离散最重要的度量是标准偏差,用 S表示 。 对于大量生产的产品来说,不可能对全部产品进行检验,通常只对其中一部分产品 ( 样本 ) 进行检验 。
当把有限数量产品测量数据按标准方差的公式求得的样本方差和总体方差作一比较,会发现这个估计值将偏小 。 因此,必须用因子 n/n-1乘上样本方差来修正,
则样本标准方差 S2为
n
i
i xxnS
1
22 )(
1
1
把样本标准方差开平方后,可得样本标准偏差为
当计算样本标准偏差时,随着样本大小 n增大,
便愈接近,则标准偏差估计值得误差将会缩小 。
n
i
i xxnS
1
2)(
1
1
数据的修整
过多的四舍五入会造成误差过大,可采取进位和舍弃机会均等的修整方法:
1)位数> 5,则:进位并舍去后面的数。
2)位数< 5,则:舍去,及后面的数。
3)位数= 5,则:
a) 后面的数为 0或无数字,5前面的数为奇数进一、
偶数舍去。
b) 后面的数不全为零,5前面的数进一、舍去 5和以后的数。
4)不得连续进行修整。
序号 平均数 四舍五入后的平均数数值修整后的平均数
1
2
3
4
5
6
7
8
9
10
12,425
12,550
12,475
12,500
12,400
12,375
12,625
12,650
12,475
12,450
12,43
12,55
12,48
12,50
12,40
12,38
12,63
12,65
12,48
12,45
12,42
12,55
12,48
12,50
12,40
12,38
12,62
12,65
12,48
12,45
合计 124,925 124,95 124,93
总平均 12,4925 12,495 12,493
四、最常见的概率分布 —正态分布
连续随机变量最重要的分布正态分布,表达形式式中,μ 为总体的算术平均值; σ 为总体的标准偏差 ;
22 2)(
2
1)(
xexf
如果我们令 Z=(x-μ)/σ,那么我们可以得到正态密度函数标准化形式为
2
2
1)( 2ZeZf
μ
μ ± σf
μ
μ ± 3σf
面积是全体变量的 68.26%落在 μ ± σ 的范围之内;
95.46%的变量是落在 μ ± 2σ 界限之内;
99.73%的变量落在 μ ± 3σ 界限之内。
但是,必须特别注意,在同样的两个已知界限内,对于 样本 界限内所占的百分比同 总体 界线内所占的百分比可能不很一致。这个差别非常重要,它构成了假设检验的基本原理 。
调查表
调查表是为了调查客观事物、产品和工作质量,或为了分层收集数据而设计的图表。即把产品可能出现的情况及其分类预先列成调查表,则检查产品时只需在相应分类中进行统计。
为了能够获得良好的效果、可比性、全面性和准确性,调查表格设计应简单明了,突出重点;
应填写方便,符号好记;调查、加工和检查的程序与调查表填写次序应基本一致,填写好的调查表要定时、准时更换并保存,数据要便于加工整理,分析整理后及时反馈。
2,缺陷位置调查表缺陷位置调查表宜与措施相联系,能充分反映缺陷发生的位置,便于研究缺陷为什么集中在那里,有助于进一步观察,探讨发生的原因 。 缺陷位置调查表可根据具体情况画出各种不同的缺陷位置调查表,图上可以划区,以便进行分层研究和对比分析 。 如表 4— 2。
3.频数调查表为了做直方图而需经过收集数据、分组、统计频数、计算、绘图等步骤。如果运用频数调查表,
那就在收集数据的同时,直接进行分解和统计频数。
4.检查确认调查表检查确认调查表是对所做工作和加工的质量进行总的检查与确认。在有限的时间内检查太多的项目,稍有疏忽,同一项目可能检查两次,而有的项目可能漏检。因此,当检查项目较多时
( 100项以上),为了不致弄错或遗漏,预先把应检查的项目统统列出来,然后按顺序,每检查一项在相应处作记号,防止遗漏。
5.作业抽样调查表作业抽样是分析作业时间的方法 。 它将全部时间分为加工,准备,空闲的时间,然后通过任意时刻,反复多次瞬间观测作业的内容,进而调查各段时间占全部时间的百分比 。
目前,调查表广泛应用于各行各业,调查表的形式也多种多样 。
分层法,
分层就是把所收集的数据进行合理的分类,
把性质相同,在同一生产条件下收集的数据归在一起,把划分的组叫做,层,,通过数据分层把错综复杂的影响质量因素分析清楚 。
当分层分不好时,会使图形的规律性隐蔽起来,还会造成假象。例如:
☆ 作直方图分层不好时,就会出现双峰型和平顶型。
☆ 排列图分层不好时,无法区分主要因素和次要因素,也无法对主要因素作进一步分析。
☆ 散布图分层不好时,会出现几簇互不关连的散点群。
☆ 控制图分层不好时,无法反映工序的真实变化,不能找出数据异常的原因,不能作出正确的判断。
☆ 因果图分层不好时,不能搞清大原因、中原因、小原因之间的真实传递途径。
例 4-1:
在柴油机装配中经常发生气缸垫漏气现象,为解决这一质量问题,对该工序进行现场统计 。
(1)收集数据,n=50,漏气数 f=19,漏气率 p =38%
(2)
通过分析,
a)该工序涂密封剂的工人 A,B,C三人的操作方法有差异;
b)气缸垫分别由甲,乙两厂供给,原材料有差异 。
因此,
由分层表,人们似乎以为,降低气缸漏气率的办法可采用乙厂提供的气缸垫和工人 B的操作方法 。
但实践结果表明,这样做漏气率非但没有降低,
反而增加到 43%,这是什么原因呢?
为此,进行更细致的综合分析,如表 4-5。
从表 4—5再次提出降低气缸漏气率的措施是:
使用甲厂提供的气缸垫时,要采用工人 B的操作方法 。
使用乙厂提供的气缸垫时,要采用工人 A的操作方法 。
实践表明,上述的分层法及采用的措施十分有效,漏气率大大降低 。
直方图,
直方图法是适用于对大量计量值数据进行整理加工,找出其统计规律,即分析数据分布的形态,以便对其总体的分布特征进行推断,对工序或批量产品的质量水平及其均匀程度进行分析的方法 。
1.作直方图的方法步骤如下
(1) 收集数据一般收集数据都要随机抽取 50个以上质量特性数据 3434,最好是 100个以上的数据,并按先后顺序排列。表 4—6是收集到的某产品数据,其样本大小用 n=100表示。
(2) 找出数据中的最大值,最小值和极差。
数据中的最大值用 xmax表示,最小值用 xmin表示,
极差用 R表示。
例 4-2
某项目统计数据为:
xmax=63,xmin=38,
极差 R= xmax- xmin=63-38=25。
区间 [xmax,xmin]称为数据的散布范围
(3) 确定组数 。
组数常用符号 k表示 。 k与数据数多少有关 。 数据多,
多分组;数据少,少分组 。
例 4-2中 100个数据,常分为 10组左右 。
k=1+3.31(logn)
例 4-2中 n=100,
k=1+3.31(1ogn)=1+3.31(log100)=7.62≈ 8
一般由于正态分布为对称形,故常取 k为奇数 。
所以例 4-2中取 k=9。
(4) 求出组距 (h)。
组距即组与组之间的间隔,等于极差除以组数,即
378.29 3863m i nm a x k xxh
(5) 确定组界为了确定边界,通常从最小值开始 。 先把最小值放在第一组的中间位置上 。
例 4-2中数据最小值 xmin=38,组距 (h)=3,
故第一组的组界为:
)2)2( m a xm i n hxhx ~(
(6) 计算各组的组中值 (wi)。
▲ 所谓组中值,就是处于各组中心位置的数值,
又叫中心值 。
▲ 某组的中心值 (wi)=(某组的上限 +某组的下限 )/2
▲ 第 一 组 的 中 心 值 (w1)= ( 36.5+39.5 ) /
2=38
▲ 第二组的 中心值 (w2)=( 39.5+42.5 2 )
/2=41
▲ 其它各组类推,组中值如表 4-7中所示 。
(7) 统计各组频数 。
统计频数的方法,如表 4-7所示 。
(8) 画直方图 。
以分组号为横坐标,以频数为高度作纵坐标,作成直方图,如图 4-2所示 。
5
10
15
20
1 2 3 4 5 6 7 8 9
43
图 4—2 直方图
22
频数组号
16
18
23
17
15
2.直方图的用途
直方图在生产中是经常使用的简便且能发挥很大作用的统计方法 。
(1) 观察与判断产品质量特性分布状态
(2)
(3) 计算工序能力,估算并了解工序能力对产
3.直方图的观察与分析
对直方图的观察,主要有两个方面:一是分析直方图的全图形状,能够发现生产过程的一些质量问题;二是把直方图和质量指标比较,观察质量是否满足要求 。
直方图可分为正常型和非正常型,下面分别它们的形状 。
( 1) 正常型
图形中央有一顶峰,左右大致对称,这时工序处于稳定状态 。 其它都属非正常型 。
正常型
(2) 偏向型
,偏右两种情形,原因是:
(a)一些形位公差要求的特性值是偏向分布 。
(b)加工者担心出现不合格品,在加工孔时往往偏小,加工轴时往往偏大造成 。
偏向型 (左 ) 偏向型 (右 )
(3) 双峰型图形出现两个顶峰极可能是由于把不同加工者或不同材料,不同加工方法,不同设备生产的两批产品混在一起形成的 。
双峰型
(4) 锯齿型图形呈锯齿状参差不齐,
多半是由于分组不当或检测数据不准而造成。
锯齿型
(5)
无突出顶峰,通常由于生产过程中缓慢变化因素影响 (如刀具磨损 )造成 。
平顶型
(6) 孤岛型由于测量有误或生产中出现异常
(原材料变化,刀具严重磨损等 )。
孤岛型
4,直方图与标准界限比较
统计分布符合标准的直方图有以下几种情况:
( 1) 理想直方图:
散布范围 B在标准界限
T=[ Tl,Tu]内,
两边有余量,
T
B
S LTl Tu
(2)B位于 T内,一边有余量,一边重合,分布中心偏移标准中心,应采取措施使分布中心与标准中心接近或重合,否则一侧无余量易出现不合格品。
(S) LTl Tu
T
B
S (L)Tl Tu
T
B
( 3) B与 T完全一致,两边无余量,易出现不合格品 。
T
B
(S) (L)Tl Tu
统计分布不符合标准的直方图有以下几种情况:
1.分布中心偏移标准中心,一侧超出标准界限,
出现不合格品。
T
B
S LTl Tu
统计分布不符合标准的直方图有以下几种情况:
2.散布范围 B大于 T,两侧超出标准界限,均出现不合格品。
T
B
S LTl Tu
尽管直方图能够很好地反映出产品质量的分布特征,但由于统计数据是样本的频数分布,它不能反映产品 随时间的过程特性 变化,有时生产过程已有趋向性变化,而直方图却属正常型,这也是直方图的局限性。
老七种工具之四,散布图
散布图是通过分析研究两种因素的数据之间的关系,来控制影响产品质量的相关因素的一种有效方法 。
有些变量之间有关系,但又不能由一个变量的数值精确地求出另一个变量的数值 。 将这两种有关的数据列出,用点子打在座标图上,然后观察这两种因素之间的关系 。 这种图就称为散布图 。
如棉纱的水分含量与伸长度之间的关系;
喷漆时的室温与漆料粘度的关系;
零件加工时切削用量与加工质量的关系;
热处理时钢的淬火温度与硬度的关系 (如图 4-9)
等等。
从图 4-9可见,数据的点子近似于一条直线,在这种情况下可以说硬度与淬火温度近似线性关系 。
散布图从图中可见,数据的点子近似于一条直线,
在这种情况下可以说硬度与淬火温度近似线性关系。
45
50
55
60
850 900
淬火温度
(oC)
硬度
HRC
图 4—9 钢的淬火温度与硬度分布图
。
。 。
。 。
。
。 。
。 。 。
。
。。 。。。
。。 。 。
。
。 。
。
。
。
。
。 。
。
。
1.散布图的观察分析根据测量的两种数据做出散布图后,观察其分布的形状和密疏程度,来判断它们关系密切程度 。
散布图大致可分为下列情形:
(1)完全正相关
x增大,y也随之增大 。 x与 y之间可用直线
y=a+bx(b为正数 )表示 。
y
x完全正相关
·
····
· ·
· ··
····
散布图大致可分为下列情形:
(2)正相关
x增大,y基本上随之增大 。 此时除了因素 x外,
可能还有其它因素影响 。
y
x正相关
····
· ·
· ··
·
·····
···
·· ·
·
散布图大致可分为下列情形:
(3)负相关
x增大,y基本上随之减小 。 同样,此时可能还有其它因素影响 。
y
x负相关
··
···· ····
·
··
·
·
··
·
散布图大致可分为下列情形:
(4)完全负相关
x增大,y随之减小 。 x与 y之间可用直线
y=a+bx(b为负数 )表示 。
y
x(d) 完全负相关
···
· ··
··
··
···
·
·
散布图大致可分为下列情形:
(5)无关
即 x变化不影响 y的变化。
y
x无关
····· ··· ······
制作与观察散布图应注意的几种情况
(a)应观察是否有异常点或离群点出现,即有个别点子脱离总体点子较远 。
如果有不正常点子应剔除;
如果是原因不明的点子,应慎重处理,以防还有其它因素影响 。
制作与观察散布图应注意的几种情况
(b)散布图如果处理不当也会造成假象,如图 。
若将 x的范围只局限在中间的那一段,则在此范围内看,y与 x似乎并不相关,但从整体看,
x与 y关系还比较密切。
○
○
○
○ ○
○ ○ ○○
○
○
○
○○
○
○
○
○
○
○
○
○
○ ○ ○
○
○
○
局部与整体的散布图
x
y
○ ○
制作与观察散布图应注意的几种情况
(c)散布图有时要分层处理。
如图,x与 y的相关关系似乎很密切,但若仔细分析,
这些数据原是来自三种不同的条件。如果这些点子分成三个不同层次 A,B,C。从每个层次中考虑,x与 y实际上并不相关 。
○ ○
○
○
○○
○ ○
○
○
○
○○
○
○
○○ ○
○
○ ○
○
○ ○
○
○
应分层处理的散布图
x
y
○
○A
B
C
2.散布图与相关系数 r
变量之间关系的密切程度,需要用一个数量指标来表示,称为相关系数,通常用 r表示。
不同的散布图有不同的相关系数,r满足:
-1≤ r≤ 1。
因此,可根据相关系数 r值来判断散布图中两个变量之间的关系。
r值 两变量间的关系,判断
r=1 完全正相关
1> r> 0 正相关 ( 越接近于 1,越强,越接近于 0,越弱 )
r=0 不相关
0> r> -1 负相关 ( 越接近于 -1,越强;越接近于 0,越弱 )
r= -1 完全负相关散布图与相关系数 r表
相关系数的计算公式是:
式中 ——表示 n个 x
——表示 n个 y
——表示 x的离差平方之和,
——表示 y的离差平方之和,
——表示 x的离差与 y的离差的乘积之和,
即
yyxx
xy
LL
L
yyxx
yyxxr
22 )()(
))((
x
y
xxL?
2)( xx
2)( yy
yyL
xyL
2)()( yyxx
通常为了避免计算离差时的麻烦和误差,在计算相关系数时,也可采用下列进行,
]){
1
][)(
1
[
))((
1
2222 y
n
yx
n
x
yx
n
xy
r
注意
r所表示线性相关。
当 r的绝对值很小甚至等于 0时,并不表示 x与 y
之间就一定不存在任何关系。如 x与 y之间虽然是有关系的,但是经过计算相关系数的结果却为 0。
这是因为此时 x与 y的关系是曲线关系,而不是线性关系造成的。
老七种工具之五:排列图
排列图是通过找出影响产品质量的主要问题,以便改进关键项目 。
排 列 图 最 早 由 意 大 利 经 济 学 家 巴 累 特
(Pareto)用于统计社会财富分布状况的 。 他发现少数人占有大部分财富,而大多数人却只有少量财富,即所谓,关键的少数与次要的多数,这一相当普遍的社会现象 。 。
排列图的形式
●
●
●
● ●
●
问题(项目)
B类
C类频数(件) 频率( %)
A类
㈠ ㈡ ㈢ ㈣ ㈥㈤
1.排列图的作图步骤
(1)
一般指不合格项目,废品件数,消耗工时等等 。
(2)
可按废品项目,缺陷项目,不同操作者等进行分类 。 列表汇总每个项目发生的数量即频数 fi,
按大小进行排列 。
(3)计算频数 fi、频率 Pi%、累计频率 Fi等 。
(4)
排列图由两个纵坐标,一个横坐标。左边的纵坐标表示频数 fi,右边的纵坐标表示频率 Pi;横坐标表示质量项目,按其频数大小从左向右排列;
各矩形的底边相等,其高度表示对应项目的频数。
排列图的作图步骤排列图的作图步骤
(5)根据排列图,确定主要,有影响,次要因素 。
主要因素 ——累计频 率 Fi在 0~80%左右的若干因素 。 它们是影响产品质量的关键原因,又称为
A类因素 。 其个数为 1~2个,最多 3个 。
有影响因素 ——累计频率 Fi在 80~95%左右的若干因素 。 它们对产品质量有一定的影响,又称为 B类因素 。
次要因素 ——累计频率 Fi在 95~100%左右的若干因素。它们对产品质量仅有轻微影响,又称为 C类因素例 4-3:某化工厂对十五台尿素塔焊缝缺陷所需工时进行统计分析,如表 4-9。
序号项 目 返修工时 fi 频率 Pi (%) 累计频率
Fi (%)
类 别
1
2
焊缝气孔夹渣
.
148
51
60.4
20.8
60.4
81.2 A
3
4
焊缝成型差焊道凹陷
20
15
8.2
6.1
89.4
95.5 B
5 其 他 11 4.5 100 C
合 计 245 100
按排列图作图步骤,确定焊缝气孔和夹渣为主要因素;焊缝成型差和焊道凹陷为有影响因素,其它为次要因素 。
●
●
● ●
●
问题(项目)
频数 fi(件) P
i 频率( %)
60.4%
焊缝气孔
81.2%
89.4% 100%95.5%
50%
夹渣焊缝成型差焊缝凹陷其它
50
100
150
200
250
2.排列图的用途
(1) 找出主要因素 。
排列图把影响产品质量的,关键的少数与次要的多数,直观地表现出来,使我们明确应该从哪里着手来提高产品质量。实践证明,集中精力将主要因素的影响减半比消灭次要因素收效显著,而且容易得多。所以应当选取排列图前 1~2项主要因素作为质量改进的目标。如果前 1~2项难度较大,而第 3项简易可行,马上可见效果,也可先对第 3
排列图的用途
(2)解决工作质量问题也可用排列图 。
不仅产品质量,其它工作如节约能源,减少消耗,
安全生产等都可用排列图改进工作,提高工作质量 。
检查质量改进措施的效果 。 采取质量改进措施后,
为了检验其效果,可用排列图来核查 。 如果确有效果,则改进后的排列图中,横坐标上因素排列顺序或频数矩形高度应有变化 。
老七种方法之六:因果图
因果图是表示质量特性与原因的关系的图 。
收集各种信息,比较原因大小和主次,找出产生问题的主要原因;也就是根据反映出来的主要问题 ( 最终结果 ),找出影响它的大原因,
中原因,小原因,更小原因等等 。
主干箭头所指的为质量问题,主干上的大枝表示大原因,中枝、小枝芽表示原因的依此展开。
中原因更小原因结果
(第一质量问题)
1.因果图作图步骤
( 1)确定要研究分析的质量问题和对象,既确定要解决的质量特性是什么。将分析对象用肯定语气(不标问号)写在图的右边,最好定量表示,
以便判断采取措施后的效果。
因果图作图步骤
( 2)确定造成这个结果和质量问题的因素分类项目。影响工序质量的因素分为人员、设备、材料、工艺方法、环境等;再依次细分,画大枝,
箭头指向主干,箭尾端记上分类项目,并用方框框上。
因果图作图步骤
( 3)把到会者发言、讨论、分析的意见归纳起来,按相互的相依隶属关系,由大到小,从粗到细,逐步深入,直到能够采取解决问题的措施为止。将上述项目分别展开:中枝表示对应的项目中造成质量问题的一个或几个原因;一个原因画一个箭头,使它平行于主干而指向大枝;把讨论、
意见归纳为短语,应言简意准,记在箭干的上面或下面,再展开,画小枝,小枝是造成中枝的原因。如此展开下去,越具体越细致,就越好。
因果图作图步骤
( 4)确定因果图中的主要、关键原因,并用符号明显的标出,再去现场调查研究,验证所确定的主要、关键原因是否找对、找准。以此作为制订质量改进措施的重点项目。一般情况下,主要、关键原因不应超过所提出的原因总数的三分之一。
因果图作图步骤
( 5) 注明本因果图的名称,日期,参加分析的人员,绘制人和参考查询事项 。
做因果图的一个重要内容就是要收集大量的信息,而许多信息是靠人们主观想象和思维得到的。
2.作因果图的注意事项
( 1)要充分发扬民主,把各种意见都记录、整理入图。一定要请当事人、知情人到会并发言,
介绍情况,发表意见。
( 2)主要、关键原因越具体,改进措施的针对性就越强。主要、关键原因初步确定后,应到现场去落实、验证主要原因,在订出切实可行的措施去解决。
作因果图的注意事项
( 3) 不要过分的追究个人责任,而要注意从组织上,管理上找原因 。 实事求是的提供质量数据和信息,不互相推托责任 。
( 4) 尽可能用数据反映,说明问题 。
作因果图的注意事项
( 5)作完因果图后,应检查下列几项:图名、
应标明主要原因是哪些等、文字是否简便通俗、
编译是否明确、定性是否准确、应尽可能地定量化、改进措施不宜画在图上。
( 6)有必要时,可再画出措施表。
老七种工具之七:控制图
控制图是判断和预报生产过程中质量状况是否发生波动的一种有效方法 。
例如:美国某电气公司的一个工厂有 3千人,制定了 5千张控制图;
美国柯达彩卷公司有 5千人,制定控制图有 3万 5千张,平均每人 7张 。
我国某飞机制造厂中的先进质量体系
(AQS)中,要求一些工序必须作控制图 。
控制图原理
质量具有波动性
随机误差
系统误差
5M1E( 工序质量因素 )
人( Man)、机器( Machine)、方法 ( Method)、
材料( Material)、测量( Measure)、环境( Environment)
影响质量的 9M因素
市场 ( Markets)
资金( Money)
管理( Management)
动机( Motivation)
人( Man)、
机器和机械化( Machines and Mechanization)、
现代信息方法 (Modem information methods),
材料( Materials)、
产品规格要求( Mounting product requirement )
1.
控制图的基本格式如图 所示 。
中心线 CL(Central Line)——用细实线表示;
上控制界限 UCL(Upper Cortrol Limit)——用虚线表示;
下控制界限 LCL(Lower Control Limit)——用虚线表示 。
UCL
●
●
●
●
●
●
●
●
●
●
CL
LCL
子样号重量特性数据
所谓控制图的基本思想就是把要控制的质量特性值用点子描在图上,若点子全部落在上、下控制界限内,且没有什么异常状况时,就可判断生产过程是处于控制状态。否则,就应根据异常情况查明并设法排除。通常,点子越过控制线就是报警的一种方式。
控制图作为一种管理图,在工业生产中,根据所要控制的质量指标的情况和数据性质分别加以选择。 如表 4-10
2.常用控制图的种类常用质量控制图可分为两大类:
( 1) 计量值控制图包括:
单值控制图 ( ),中位数控制图 。
( 2)计数值控制图包括:
不良品数控制图,
不良品率控制图,
缺陷数控制图,
单位缺陷数控制图。
x
根据所要控制的质量特性和数据的种类、条件等,按图中得箭头方向便可作出正确的选用。
数据种类样本容量指标中心位置计数值计量值复数不良品缺陷平均数中位数平均值 — 极差控制图 (— R)
中位数控制图 ()
缺陷数控制图 (C)
单位缺陷数控制图 (u)
单值控制图 (x)单数单值 — 移动极差控制图 (x— RS)
样本容量确定不确定不良品数控制图 (Pn)
不良品率控制图 (P)
确定不确定样本容量图 4— 18 控制图的种类及选用流程
计量值 控制图一般适用于以计量值为控制对象的场合 。
计量值控制图对工序中存在的系统性原因反应敏感,所以具有及时查明并消除异常的明显作用,
其效果比计数值控制图显著。计量值控制图经常用来预防、分析和控制工序加工质量,特别是几种控制图的联合使用。
计数值 控制图则用于以计数值为控制对象的场合 。 离散型的数值,比如,一个产品批的不合格品件数 。 虽然其取值范围是确定的,但取值具有随机性,只有在检验之后才能确定下来 。
计数值控制图的作用与计量值控制图类似,
其目的也是为了分析和控制生产工序的稳定性,
预防不合格品的发生,保证产品质量。
3.控制界限的原理
控制图中的上,下控制界限,一般是用,三倍标准偏差法,(又称 3σ 法 )。 而把中心线确定在被控制对象 (如平均值,极差,中位数等 )的平均值上 。 再以中心线为基准向上或向下量 3倍标准偏差,就确定了上,下控制界限 。 另外,在求各种控制图时,3倍标准偏差并不容易求到,故按统计理论计算出一些近似系数用于各种控制图的计算信息输入表 4-11( 下页 )
表 4-11 计量值控制图计算公式中的系数值表小组观察数目 (n)
A2 D3 D4 m3A2 E2 1/d2
2 1.830 / 3.267 1.880 2.660 0.886
3 1.023 / 2.575 1.187 1.772 0.591
4 0.729 / 2.232 0.796 1.457 0.486
5 0.577 / 2.115 0.691 1.290 0.430
6 0.483 / 2.004 0.549 1.184 0.395
7 0.419 0.076 1.924 0.509 1.109 0.370
8 0.373 0.136 1.864 0.432 1.054 0.351
9 0.337 0.184 1.816 0.412 1.010 0.337
10 0.308 0.223 1.777 0.363 0.945 0.32
例 4-4:某厂生产 φ 10± 0.20毫米的圆柱销,
每隔一定时间随机抽取 5个样品,共取 20组,所得数据 。表 4-12
例 4-4
解,(1)平均值的中心值,
( 2) 根据表 4-15的计算公式求出:
(3)根据 R
( 4)根据以上数据作图并打点。
922.9)136.058.0(001.10
080.10)136.058.0(001.10
2
2 RAxL C L RAxU C L
0 0 1.10?x 13 6.0?R
不必要图的
,
287.0136.011.2
136.0
4L C L RDU C L
RCLR
4.控制图的分析与判断
用控制图识别生产过程的状态,主要是根据样本数据形成的样本点位置以及变化趋势进行分析和判断,判断工序是处于受控状态还是失控状态。
1) 受控状态的判断
工序是否处于受控状态(或稳定状态),其判断的条件有两个:
(a) 在控制界限内的点子排列无缺陷;
(b) 控制图上的所有样本点全部落在控制界限之内。
在满足了条件 (a)的情况下,对于条件 (b),若点子的排列是随机地处于下列情况,则可认为工序处于受控状态 。
(1) 连续 25个点子没有 1点在控制界限以外;
(2) 连续 35个点子中最多有 1点在控制界限以外;
(3) 连续 100个点子中最多有 2点在控制界限以外 。
若过程为正态分布,d为界外点数,则
P(连续 35点,d≤1)
=C035(0.9973)35+ C135(0.9973)34(0.0027)=0.9959
P(连续 35点,d> 1)=1-0.9959=0.0041
于 0.0027位统一数量级的小概率。
同理,
P(连续 100点,d> 2)=0.0026
但是
P(连 25点,d > 0)=0.0654 (有人建议这一判据应划为稳态 )
2) 失控状态的判断只要控制图上的点子出现下列情况时,就可判断工序为失控状态:
(a) 控制图上的点子超出控制界限外或恰好在在界限上; (针对判真为假而言,α越小越好 )
(b) 控制界限内的点子排列方式有缺陷,呈现非随机排列 。 (针对判假为真而言,β越小越好 )
α
β
UCL
CL
LCL
两类错误往往不可避免,α减少而 β减少,反之,
β减少而 α减少。因此,只能根据两类错误造成的总损失最小来确定上下的控制界限。
控制图有缺陷的状态
(1)点子越出控制界限 。
(2)点子在控制界限附近,即在 2σ~3σ之间 。
(称为警戒区间 )
a) 3点中有 2点在警戒区内 ( 0.0053) ;
3σ 2σ
μ●
● ●
●
●
●
●
b) 7点中有 3点在警戒区内;
c) 10点中有 4点在警戒区内。
3σ 2σ
μ●
● ●
●
●
●
●
说明,μ ± 2σ —μ ± 3σ 的概率为 0.0428
μ ± 2σ ——0.9545; μ ± 3σ ——0.9973
连续 3点有 2点在 2σ — 3σ 区间
连续 7点有 3点在 2σ — 3σ 区间
3
2
3
3 0053.0)9973.0()0428.0(
k
kkkcp
7
3
7
7 0024.0)9973.0()0428.0(
k
kkkcp
控制图有缺陷的状态
(3)点子在中心线一侧连续出现 。
a 连续 7点在中心线一侧 。
3σ
μ●
● ●
● ●
-3σ
● ● ● ●
在一侧出现连续 7点的概率为
b 连续 11点中有 10点在中心线一侧;
0 0 7 6 6.0)29 9 7 3.0( 77p
11
1
11
11 0 0 5 9.0)9 9 7 3.0()9 9 7 3.0(
k
kkkcp
c 连续 14点中有 12点在中心线一侧;
d 连续 17点中有 14点在中心线一侧;
e 连续 20点中有 17点在中心线一侧 。
控制图有缺陷的状态
(4)点子有连续上升或下降趋向,如点数 ≥7,
则判断有系统性因素影响 。
(5)点子的波动呈现周期性变化,表明生产过程有系统性因素发生。
-3σ
μ●
● ●
● ●
●
●
●
●
●
5.控制图的两种错误判断
根据控制图的控制界限所作的判断也可能发生错误 。 这种可能的错误有两种:
第一种错误是将正常判为异常;
第二种错误是将异常判为正常。
控制图的两种错误
在生产正常的情况下,点子出界的可能性为 3‰ 。
这数值虽然很小,但这类事件总还不是绝对不能发生的。这样,在纯粹出于偶然点子出界的场合,
我们根据点子出界判断生产过程异常就犯了虚发警报的错误,这种错误就叫做第一种错误。
另有一种情况,即生产过程已经有了异常,产品质量的分布偏离了典型分布,可是总还有一个部分产品的质量特征值是在上下控制界线之内的。
如果我们抽取到这样的产品进行检验,那么,这时由于点子未出界而判断生产过程正常,就犯了漏发警报的错误,这种错误就叫做第二种错误。
控制图应用的预防原则
“20字,,查出异因,采取措施,保证消除,不再出现,纳入标准。
控制图显示异常贯彻 20字控制稳态调整控制界限有无异因有无
控制图上只是打打点时起不到预防作用的。要每贯彻一次,20字,就消除一次异因,使它不再出现,从而达到预防的目的。
一道工序处于稳态成为稳态工序,道道工序处于稳态成为全稳生产线,SPC就是通过全稳生产线达到全过程预防的。
步骤
1)培训
2)确定关键变量(关键质量因素) (美 LTV钢铁公司共确定了 2万个关键变量)
3)提出或改进规格标准 (关键变量分析、填写过程控制标准表)
4)编制控制标准手册 ( 美 LTV钢铁公司编制了 600多本 )
5)进行统计监控
6)对过程进行诊断并采取措施解决问题。( 美 LTV钢铁公司实施
SPC,劳动生产率提高了 20%以上 )
所在车间 控制点 控制因素文件号 日期控制内容过程标准控制理由测量规定数据报告途径控制图 有无建立控制图类型 制定日期 批准日期纠正性措施操作程序审核程序制定者 审批者 审批日期过程控制标准表应用控制图需要考虑的一些问题
1、控制图用于何处?(定量、重复、有统计规律)
2、如何选择控制参数?(特征、有代表性、要求高)
3、怎样选择控制图?(计量、计数)
4、如何分析控制图?(判断前,样品是否随机,读数是否准、计算和描点有无差错)
5、对点子出界或违反规定的处理( 20字、关键要预防)
6、控制图是警铃(判断异常、查原因)
7、控制图的重新制定和保管。
分析用 ~控制图;控制用 ~控制图
分析用:
1、分析生产过程是否处于稳态? ( 调整 → 稳态(统计稳态) )
2、分析生产过程的工序能力是否处于技术要求?
(调整工序能力 → 满足 )
有四种组合的现象
控制用:
当过程达到确定的状态后,才能将分析用的控制图的控制延长线作为控制用控制图。(执行 20字)
1.1质量特性及其数据整理
一、数据的种类
1.计量值数据
(长度、重量、电流、温度等。测量结果的数据可以是连续的,
质量特性不能连续取值的,只能以个数计算的数为计数值数据。(不合格品数、缺陷数)
质量特性的分布单个产品质量特性是随机的,但是一批产品的质量特性却是呈现某种规律性。
数据整理方法及图示
计量数据的分组统计与直方图
1,频数频率分布表
① 寻找组数据极差,一组测量数据中的最大值和最小值之差,通常用于表示不分组数据的离散度,用符号 R表示:
m i nm a x xxR
二、总体和样本
把所研究的对象的全体称为全及总体,也叫做母体或简称为总体 。
通常全及总体的单位数用 N来表示,样本单位数称为样本容量,用 n来表示 。 相对于 N来说,
n则是个很小的数 。 它可以是总体的几十分之一乃至几万分之一 。
我们抽取的样本后获得的质量特性的值记为称为样本观察值 。n,x,2,x1x L
② 根据样本的容量 n决定分组数 k和每组的组距 d,关于组数 k有一个推荐使用的公式:
K=1+3.322lg(n)
注:这个公式不是绝对的,选择的原则是要能反映数据中所隐藏的规律,组数不能过多也不能过少。
2,直方图直方图法是适用于对大量计量值数据进行整理加工,找出其统计规律,即分析数据分布的形态,以便对其总体的分布特征进行推断,对工序或批量产品的质量水平及其均匀程度进行分析的方法。
三、数据特征值
数据特征值是数据分布趋势的一种度量。
数据特征值可以分为两类。
集中度,平均值、中位数、众数等;
离散度,极差、平均偏差、均方根偏差、标准偏差等。
1.表示数据集中趋势的特征值
(1)频数
计算各个值反复出现的次数,称之为频数。
(2)
如果产品质量有 n个测量数据 xi(i=1,2,…,n),平均值为:
如果测量数据按大小分组,则平均值为
n
i
ixnx
1
1
n
i
ii xfnx
1
1
(3)
数据按大小顺序排列,排在中间的那个数称为中位数 。 用 表示 。 当数据总数为奇数时,最中间的数就是;当数据总数为偶数时,中位数为中间两个数据的平均值 。
(4)众数
众数是一组测量数据中出现次数 (频数 )最多的那个数值,一般用 M0表示 。
x~
2.
(1) 极差极差是一组测量数据中的最大值和最小值之差 。 通常用于表示不分组数据的离散度,用符号 R表示 。
m i nm a x xxR
(2) 平均偏差将每个数据减去平均值,并把它们的差值的绝对值相加再除以测量数据的总个数,即得到平均偏差,用 AD表示。
n
i
iiD xxFnA
1
1
(3)均方根偏差
均方根偏差是测量数据平均值之差的平方和被总测数平均,然后再求其平均值,用 σ表示。
用均方根偏差作为的度量,可以直接比较两组数据的均方根偏差的大小就可看出两组数据离散程度的大小。
2
1
1?
n
i
ii xxFn?
(4)标准偏差
测量数据分布的离散最重要的度量是标准偏差,用 S表示 。 对于大量生产的产品来说,不可能对全部产品进行检验,通常只对其中一部分产品 ( 样本 ) 进行检验 。
当把有限数量产品测量数据按标准方差的公式求得的样本方差和总体方差作一比较,会发现这个估计值将偏小 。 因此,必须用因子 n/n-1乘上样本方差来修正,
则样本标准方差 S2为
n
i
i xxnS
1
22 )(
1
1
把样本标准方差开平方后,可得样本标准偏差为
当计算样本标准偏差时,随着样本大小 n增大,
便愈接近,则标准偏差估计值得误差将会缩小 。
n
i
i xxnS
1
2)(
1
1
数据的修整
过多的四舍五入会造成误差过大,可采取进位和舍弃机会均等的修整方法:
1)位数> 5,则:进位并舍去后面的数。
2)位数< 5,则:舍去,及后面的数。
3)位数= 5,则:
a) 后面的数为 0或无数字,5前面的数为奇数进一、
偶数舍去。
b) 后面的数不全为零,5前面的数进一、舍去 5和以后的数。
4)不得连续进行修整。
序号 平均数 四舍五入后的平均数数值修整后的平均数
1
2
3
4
5
6
7
8
9
10
12,425
12,550
12,475
12,500
12,400
12,375
12,625
12,650
12,475
12,450
12,43
12,55
12,48
12,50
12,40
12,38
12,63
12,65
12,48
12,45
12,42
12,55
12,48
12,50
12,40
12,38
12,62
12,65
12,48
12,45
合计 124,925 124,95 124,93
总平均 12,4925 12,495 12,493
四、最常见的概率分布 —正态分布
连续随机变量最重要的分布正态分布,表达形式式中,μ 为总体的算术平均值; σ 为总体的标准偏差 ;
22 2)(
2
1)(
xexf
如果我们令 Z=(x-μ)/σ,那么我们可以得到正态密度函数标准化形式为
2
2
1)( 2ZeZf
μ
μ ± σf
μ
μ ± 3σf
面积是全体变量的 68.26%落在 μ ± σ 的范围之内;
95.46%的变量是落在 μ ± 2σ 界限之内;
99.73%的变量落在 μ ± 3σ 界限之内。
但是,必须特别注意,在同样的两个已知界限内,对于 样本 界限内所占的百分比同 总体 界线内所占的百分比可能不很一致。这个差别非常重要,它构成了假设检验的基本原理 。
调查表
调查表是为了调查客观事物、产品和工作质量,或为了分层收集数据而设计的图表。即把产品可能出现的情况及其分类预先列成调查表,则检查产品时只需在相应分类中进行统计。
为了能够获得良好的效果、可比性、全面性和准确性,调查表格设计应简单明了,突出重点;
应填写方便,符号好记;调查、加工和检查的程序与调查表填写次序应基本一致,填写好的调查表要定时、准时更换并保存,数据要便于加工整理,分析整理后及时反馈。
2,缺陷位置调查表缺陷位置调查表宜与措施相联系,能充分反映缺陷发生的位置,便于研究缺陷为什么集中在那里,有助于进一步观察,探讨发生的原因 。 缺陷位置调查表可根据具体情况画出各种不同的缺陷位置调查表,图上可以划区,以便进行分层研究和对比分析 。 如表 4— 2。
3.频数调查表为了做直方图而需经过收集数据、分组、统计频数、计算、绘图等步骤。如果运用频数调查表,
那就在收集数据的同时,直接进行分解和统计频数。
4.检查确认调查表检查确认调查表是对所做工作和加工的质量进行总的检查与确认。在有限的时间内检查太多的项目,稍有疏忽,同一项目可能检查两次,而有的项目可能漏检。因此,当检查项目较多时
( 100项以上),为了不致弄错或遗漏,预先把应检查的项目统统列出来,然后按顺序,每检查一项在相应处作记号,防止遗漏。
5.作业抽样调查表作业抽样是分析作业时间的方法 。 它将全部时间分为加工,准备,空闲的时间,然后通过任意时刻,反复多次瞬间观测作业的内容,进而调查各段时间占全部时间的百分比 。
目前,调查表广泛应用于各行各业,调查表的形式也多种多样 。
分层法,
分层就是把所收集的数据进行合理的分类,
把性质相同,在同一生产条件下收集的数据归在一起,把划分的组叫做,层,,通过数据分层把错综复杂的影响质量因素分析清楚 。
当分层分不好时,会使图形的规律性隐蔽起来,还会造成假象。例如:
☆ 作直方图分层不好时,就会出现双峰型和平顶型。
☆ 排列图分层不好时,无法区分主要因素和次要因素,也无法对主要因素作进一步分析。
☆ 散布图分层不好时,会出现几簇互不关连的散点群。
☆ 控制图分层不好时,无法反映工序的真实变化,不能找出数据异常的原因,不能作出正确的判断。
☆ 因果图分层不好时,不能搞清大原因、中原因、小原因之间的真实传递途径。
例 4-1:
在柴油机装配中经常发生气缸垫漏气现象,为解决这一质量问题,对该工序进行现场统计 。
(1)收集数据,n=50,漏气数 f=19,漏气率 p =38%
(2)
通过分析,
a)该工序涂密封剂的工人 A,B,C三人的操作方法有差异;
b)气缸垫分别由甲,乙两厂供给,原材料有差异 。
因此,
由分层表,人们似乎以为,降低气缸漏气率的办法可采用乙厂提供的气缸垫和工人 B的操作方法 。
但实践结果表明,这样做漏气率非但没有降低,
反而增加到 43%,这是什么原因呢?
为此,进行更细致的综合分析,如表 4-5。
从表 4—5再次提出降低气缸漏气率的措施是:
使用甲厂提供的气缸垫时,要采用工人 B的操作方法 。
使用乙厂提供的气缸垫时,要采用工人 A的操作方法 。
实践表明,上述的分层法及采用的措施十分有效,漏气率大大降低 。
直方图,
直方图法是适用于对大量计量值数据进行整理加工,找出其统计规律,即分析数据分布的形态,以便对其总体的分布特征进行推断,对工序或批量产品的质量水平及其均匀程度进行分析的方法 。
1.作直方图的方法步骤如下
(1) 收集数据一般收集数据都要随机抽取 50个以上质量特性数据 3434,最好是 100个以上的数据,并按先后顺序排列。表 4—6是收集到的某产品数据,其样本大小用 n=100表示。
(2) 找出数据中的最大值,最小值和极差。
数据中的最大值用 xmax表示,最小值用 xmin表示,
极差用 R表示。
例 4-2
某项目统计数据为:
xmax=63,xmin=38,
极差 R= xmax- xmin=63-38=25。
区间 [xmax,xmin]称为数据的散布范围
(3) 确定组数 。
组数常用符号 k表示 。 k与数据数多少有关 。 数据多,
多分组;数据少,少分组 。
例 4-2中 100个数据,常分为 10组左右 。
k=1+3.31(logn)
例 4-2中 n=100,
k=1+3.31(1ogn)=1+3.31(log100)=7.62≈ 8
一般由于正态分布为对称形,故常取 k为奇数 。
所以例 4-2中取 k=9。
(4) 求出组距 (h)。
组距即组与组之间的间隔,等于极差除以组数,即
378.29 3863m i nm a x k xxh
(5) 确定组界为了确定边界,通常从最小值开始 。 先把最小值放在第一组的中间位置上 。
例 4-2中数据最小值 xmin=38,组距 (h)=3,
故第一组的组界为:
)2)2( m a xm i n hxhx ~(
(6) 计算各组的组中值 (wi)。
▲ 所谓组中值,就是处于各组中心位置的数值,
又叫中心值 。
▲ 某组的中心值 (wi)=(某组的上限 +某组的下限 )/2
▲ 第 一 组 的 中 心 值 (w1)= ( 36.5+39.5 ) /
2=38
▲ 第二组的 中心值 (w2)=( 39.5+42.5 2 )
/2=41
▲ 其它各组类推,组中值如表 4-7中所示 。
(7) 统计各组频数 。
统计频数的方法,如表 4-7所示 。
(8) 画直方图 。
以分组号为横坐标,以频数为高度作纵坐标,作成直方图,如图 4-2所示 。
5
10
15
20
1 2 3 4 5 6 7 8 9
43
图 4—2 直方图
22
频数组号
16
18
23
17
15
2.直方图的用途
直方图在生产中是经常使用的简便且能发挥很大作用的统计方法 。
(1) 观察与判断产品质量特性分布状态
(2)
(3) 计算工序能力,估算并了解工序能力对产
3.直方图的观察与分析
对直方图的观察,主要有两个方面:一是分析直方图的全图形状,能够发现生产过程的一些质量问题;二是把直方图和质量指标比较,观察质量是否满足要求 。
直方图可分为正常型和非正常型,下面分别它们的形状 。
( 1) 正常型
图形中央有一顶峰,左右大致对称,这时工序处于稳定状态 。 其它都属非正常型 。
正常型
(2) 偏向型
,偏右两种情形,原因是:
(a)一些形位公差要求的特性值是偏向分布 。
(b)加工者担心出现不合格品,在加工孔时往往偏小,加工轴时往往偏大造成 。
偏向型 (左 ) 偏向型 (右 )
(3) 双峰型图形出现两个顶峰极可能是由于把不同加工者或不同材料,不同加工方法,不同设备生产的两批产品混在一起形成的 。
双峰型
(4) 锯齿型图形呈锯齿状参差不齐,
多半是由于分组不当或检测数据不准而造成。
锯齿型
(5)
无突出顶峰,通常由于生产过程中缓慢变化因素影响 (如刀具磨损 )造成 。
平顶型
(6) 孤岛型由于测量有误或生产中出现异常
(原材料变化,刀具严重磨损等 )。
孤岛型
4,直方图与标准界限比较
统计分布符合标准的直方图有以下几种情况:
( 1) 理想直方图:
散布范围 B在标准界限
T=[ Tl,Tu]内,
两边有余量,
T
B
S LTl Tu
(2)B位于 T内,一边有余量,一边重合,分布中心偏移标准中心,应采取措施使分布中心与标准中心接近或重合,否则一侧无余量易出现不合格品。
(S) LTl Tu
T
B
S (L)Tl Tu
T
B
( 3) B与 T完全一致,两边无余量,易出现不合格品 。
T
B
(S) (L)Tl Tu
统计分布不符合标准的直方图有以下几种情况:
1.分布中心偏移标准中心,一侧超出标准界限,
出现不合格品。
T
B
S LTl Tu
统计分布不符合标准的直方图有以下几种情况:
2.散布范围 B大于 T,两侧超出标准界限,均出现不合格品。
T
B
S LTl Tu
尽管直方图能够很好地反映出产品质量的分布特征,但由于统计数据是样本的频数分布,它不能反映产品 随时间的过程特性 变化,有时生产过程已有趋向性变化,而直方图却属正常型,这也是直方图的局限性。
老七种工具之四,散布图
散布图是通过分析研究两种因素的数据之间的关系,来控制影响产品质量的相关因素的一种有效方法 。
有些变量之间有关系,但又不能由一个变量的数值精确地求出另一个变量的数值 。 将这两种有关的数据列出,用点子打在座标图上,然后观察这两种因素之间的关系 。 这种图就称为散布图 。
如棉纱的水分含量与伸长度之间的关系;
喷漆时的室温与漆料粘度的关系;
零件加工时切削用量与加工质量的关系;
热处理时钢的淬火温度与硬度的关系 (如图 4-9)
等等。
从图 4-9可见,数据的点子近似于一条直线,在这种情况下可以说硬度与淬火温度近似线性关系 。
散布图从图中可见,数据的点子近似于一条直线,
在这种情况下可以说硬度与淬火温度近似线性关系。
45
50
55
60
850 900
淬火温度
(oC)
硬度
HRC
图 4—9 钢的淬火温度与硬度分布图
。
。 。
。 。
。
。 。
。 。 。
。
。。 。。。
。。 。 。
。
。 。
。
。
。
。
。 。
。
。
1.散布图的观察分析根据测量的两种数据做出散布图后,观察其分布的形状和密疏程度,来判断它们关系密切程度 。
散布图大致可分为下列情形:
(1)完全正相关
x增大,y也随之增大 。 x与 y之间可用直线
y=a+bx(b为正数 )表示 。
y
x完全正相关
·
····
· ·
· ··
····
散布图大致可分为下列情形:
(2)正相关
x增大,y基本上随之增大 。 此时除了因素 x外,
可能还有其它因素影响 。
y
x正相关
····
· ·
· ··
·
·····
···
·· ·
·
散布图大致可分为下列情形:
(3)负相关
x增大,y基本上随之减小 。 同样,此时可能还有其它因素影响 。
y
x负相关
··
···· ····
·
··
·
·
··
·
散布图大致可分为下列情形:
(4)完全负相关
x增大,y随之减小 。 x与 y之间可用直线
y=a+bx(b为负数 )表示 。
y
x(d) 完全负相关
···
· ··
··
··
···
·
·
散布图大致可分为下列情形:
(5)无关
即 x变化不影响 y的变化。
y
x无关
····· ··· ······
制作与观察散布图应注意的几种情况
(a)应观察是否有异常点或离群点出现,即有个别点子脱离总体点子较远 。
如果有不正常点子应剔除;
如果是原因不明的点子,应慎重处理,以防还有其它因素影响 。
制作与观察散布图应注意的几种情况
(b)散布图如果处理不当也会造成假象,如图 。
若将 x的范围只局限在中间的那一段,则在此范围内看,y与 x似乎并不相关,但从整体看,
x与 y关系还比较密切。
○
○
○
○ ○
○ ○ ○○
○
○
○
○○
○
○
○
○
○
○
○
○
○ ○ ○
○
○
○
局部与整体的散布图
x
y
○ ○
制作与观察散布图应注意的几种情况
(c)散布图有时要分层处理。
如图,x与 y的相关关系似乎很密切,但若仔细分析,
这些数据原是来自三种不同的条件。如果这些点子分成三个不同层次 A,B,C。从每个层次中考虑,x与 y实际上并不相关 。
○ ○
○
○
○○
○ ○
○
○
○
○○
○
○
○○ ○
○
○ ○
○
○ ○
○
○
应分层处理的散布图
x
y
○
○A
B
C
2.散布图与相关系数 r
变量之间关系的密切程度,需要用一个数量指标来表示,称为相关系数,通常用 r表示。
不同的散布图有不同的相关系数,r满足:
-1≤ r≤ 1。
因此,可根据相关系数 r值来判断散布图中两个变量之间的关系。
r值 两变量间的关系,判断
r=1 完全正相关
1> r> 0 正相关 ( 越接近于 1,越强,越接近于 0,越弱 )
r=0 不相关
0> r> -1 负相关 ( 越接近于 -1,越强;越接近于 0,越弱 )
r= -1 完全负相关散布图与相关系数 r表
相关系数的计算公式是:
式中 ——表示 n个 x
——表示 n个 y
——表示 x的离差平方之和,
——表示 y的离差平方之和,
——表示 x的离差与 y的离差的乘积之和,
即
yyxx
xy
LL
L
yyxx
yyxxr
22 )()(
))((
x
y
xxL?
2)( xx
2)( yy
yyL
xyL
2)()( yyxx
通常为了避免计算离差时的麻烦和误差,在计算相关系数时,也可采用下列进行,
]){
1
][)(
1
[
))((
1
2222 y
n
yx
n
x
yx
n
xy
r
注意
r所表示线性相关。
当 r的绝对值很小甚至等于 0时,并不表示 x与 y
之间就一定不存在任何关系。如 x与 y之间虽然是有关系的,但是经过计算相关系数的结果却为 0。
这是因为此时 x与 y的关系是曲线关系,而不是线性关系造成的。
老七种工具之五:排列图
排列图是通过找出影响产品质量的主要问题,以便改进关键项目 。
排 列 图 最 早 由 意 大 利 经 济 学 家 巴 累 特
(Pareto)用于统计社会财富分布状况的 。 他发现少数人占有大部分财富,而大多数人却只有少量财富,即所谓,关键的少数与次要的多数,这一相当普遍的社会现象 。 。
排列图的形式
●
●
●
● ●
●
问题(项目)
B类
C类频数(件) 频率( %)
A类
㈠ ㈡ ㈢ ㈣ ㈥㈤
1.排列图的作图步骤
(1)
一般指不合格项目,废品件数,消耗工时等等 。
(2)
可按废品项目,缺陷项目,不同操作者等进行分类 。 列表汇总每个项目发生的数量即频数 fi,
按大小进行排列 。
(3)计算频数 fi、频率 Pi%、累计频率 Fi等 。
(4)
排列图由两个纵坐标,一个横坐标。左边的纵坐标表示频数 fi,右边的纵坐标表示频率 Pi;横坐标表示质量项目,按其频数大小从左向右排列;
各矩形的底边相等,其高度表示对应项目的频数。
排列图的作图步骤排列图的作图步骤
(5)根据排列图,确定主要,有影响,次要因素 。
主要因素 ——累计频 率 Fi在 0~80%左右的若干因素 。 它们是影响产品质量的关键原因,又称为
A类因素 。 其个数为 1~2个,最多 3个 。
有影响因素 ——累计频率 Fi在 80~95%左右的若干因素 。 它们对产品质量有一定的影响,又称为 B类因素 。
次要因素 ——累计频率 Fi在 95~100%左右的若干因素。它们对产品质量仅有轻微影响,又称为 C类因素例 4-3:某化工厂对十五台尿素塔焊缝缺陷所需工时进行统计分析,如表 4-9。
序号项 目 返修工时 fi 频率 Pi (%) 累计频率
Fi (%)
类 别
1
2
焊缝气孔夹渣
.
148
51
60.4
20.8
60.4
81.2 A
3
4
焊缝成型差焊道凹陷
20
15
8.2
6.1
89.4
95.5 B
5 其 他 11 4.5 100 C
合 计 245 100
按排列图作图步骤,确定焊缝气孔和夹渣为主要因素;焊缝成型差和焊道凹陷为有影响因素,其它为次要因素 。
●
●
● ●
●
问题(项目)
频数 fi(件) P
i 频率( %)
60.4%
焊缝气孔
81.2%
89.4% 100%95.5%
50%
夹渣焊缝成型差焊缝凹陷其它
50
100
150
200
250
2.排列图的用途
(1) 找出主要因素 。
排列图把影响产品质量的,关键的少数与次要的多数,直观地表现出来,使我们明确应该从哪里着手来提高产品质量。实践证明,集中精力将主要因素的影响减半比消灭次要因素收效显著,而且容易得多。所以应当选取排列图前 1~2项主要因素作为质量改进的目标。如果前 1~2项难度较大,而第 3项简易可行,马上可见效果,也可先对第 3
排列图的用途
(2)解决工作质量问题也可用排列图 。
不仅产品质量,其它工作如节约能源,减少消耗,
安全生产等都可用排列图改进工作,提高工作质量 。
检查质量改进措施的效果 。 采取质量改进措施后,
为了检验其效果,可用排列图来核查 。 如果确有效果,则改进后的排列图中,横坐标上因素排列顺序或频数矩形高度应有变化 。
老七种方法之六:因果图
因果图是表示质量特性与原因的关系的图 。
收集各种信息,比较原因大小和主次,找出产生问题的主要原因;也就是根据反映出来的主要问题 ( 最终结果 ),找出影响它的大原因,
中原因,小原因,更小原因等等 。
主干箭头所指的为质量问题,主干上的大枝表示大原因,中枝、小枝芽表示原因的依此展开。
中原因更小原因结果
(第一质量问题)
1.因果图作图步骤
( 1)确定要研究分析的质量问题和对象,既确定要解决的质量特性是什么。将分析对象用肯定语气(不标问号)写在图的右边,最好定量表示,
以便判断采取措施后的效果。
因果图作图步骤
( 2)确定造成这个结果和质量问题的因素分类项目。影响工序质量的因素分为人员、设备、材料、工艺方法、环境等;再依次细分,画大枝,
箭头指向主干,箭尾端记上分类项目,并用方框框上。
因果图作图步骤
( 3)把到会者发言、讨论、分析的意见归纳起来,按相互的相依隶属关系,由大到小,从粗到细,逐步深入,直到能够采取解决问题的措施为止。将上述项目分别展开:中枝表示对应的项目中造成质量问题的一个或几个原因;一个原因画一个箭头,使它平行于主干而指向大枝;把讨论、
意见归纳为短语,应言简意准,记在箭干的上面或下面,再展开,画小枝,小枝是造成中枝的原因。如此展开下去,越具体越细致,就越好。
因果图作图步骤
( 4)确定因果图中的主要、关键原因,并用符号明显的标出,再去现场调查研究,验证所确定的主要、关键原因是否找对、找准。以此作为制订质量改进措施的重点项目。一般情况下,主要、关键原因不应超过所提出的原因总数的三分之一。
因果图作图步骤
( 5) 注明本因果图的名称,日期,参加分析的人员,绘制人和参考查询事项 。
做因果图的一个重要内容就是要收集大量的信息,而许多信息是靠人们主观想象和思维得到的。
2.作因果图的注意事项
( 1)要充分发扬民主,把各种意见都记录、整理入图。一定要请当事人、知情人到会并发言,
介绍情况,发表意见。
( 2)主要、关键原因越具体,改进措施的针对性就越强。主要、关键原因初步确定后,应到现场去落实、验证主要原因,在订出切实可行的措施去解决。
作因果图的注意事项
( 3) 不要过分的追究个人责任,而要注意从组织上,管理上找原因 。 实事求是的提供质量数据和信息,不互相推托责任 。
( 4) 尽可能用数据反映,说明问题 。
作因果图的注意事项
( 5)作完因果图后,应检查下列几项:图名、
应标明主要原因是哪些等、文字是否简便通俗、
编译是否明确、定性是否准确、应尽可能地定量化、改进措施不宜画在图上。
( 6)有必要时,可再画出措施表。
老七种工具之七:控制图
控制图是判断和预报生产过程中质量状况是否发生波动的一种有效方法 。
例如:美国某电气公司的一个工厂有 3千人,制定了 5千张控制图;
美国柯达彩卷公司有 5千人,制定控制图有 3万 5千张,平均每人 7张 。
我国某飞机制造厂中的先进质量体系
(AQS)中,要求一些工序必须作控制图 。
控制图原理
质量具有波动性
随机误差
系统误差
5M1E( 工序质量因素 )
人( Man)、机器( Machine)、方法 ( Method)、
材料( Material)、测量( Measure)、环境( Environment)
影响质量的 9M因素
市场 ( Markets)
资金( Money)
管理( Management)
动机( Motivation)
人( Man)、
机器和机械化( Machines and Mechanization)、
现代信息方法 (Modem information methods),
材料( Materials)、
产品规格要求( Mounting product requirement )
1.
控制图的基本格式如图 所示 。
中心线 CL(Central Line)——用细实线表示;
上控制界限 UCL(Upper Cortrol Limit)——用虚线表示;
下控制界限 LCL(Lower Control Limit)——用虚线表示 。
UCL
●
●
●
●
●
●
●
●
●
●
CL
LCL
子样号重量特性数据
所谓控制图的基本思想就是把要控制的质量特性值用点子描在图上,若点子全部落在上、下控制界限内,且没有什么异常状况时,就可判断生产过程是处于控制状态。否则,就应根据异常情况查明并设法排除。通常,点子越过控制线就是报警的一种方式。
控制图作为一种管理图,在工业生产中,根据所要控制的质量指标的情况和数据性质分别加以选择。 如表 4-10
2.常用控制图的种类常用质量控制图可分为两大类:
( 1) 计量值控制图包括:
单值控制图 ( ),中位数控制图 。
( 2)计数值控制图包括:
不良品数控制图,
不良品率控制图,
缺陷数控制图,
单位缺陷数控制图。
x
根据所要控制的质量特性和数据的种类、条件等,按图中得箭头方向便可作出正确的选用。
数据种类样本容量指标中心位置计数值计量值复数不良品缺陷平均数中位数平均值 — 极差控制图 (— R)
中位数控制图 ()
缺陷数控制图 (C)
单位缺陷数控制图 (u)
单值控制图 (x)单数单值 — 移动极差控制图 (x— RS)
样本容量确定不确定不良品数控制图 (Pn)
不良品率控制图 (P)
确定不确定样本容量图 4— 18 控制图的种类及选用流程
计量值 控制图一般适用于以计量值为控制对象的场合 。
计量值控制图对工序中存在的系统性原因反应敏感,所以具有及时查明并消除异常的明显作用,
其效果比计数值控制图显著。计量值控制图经常用来预防、分析和控制工序加工质量,特别是几种控制图的联合使用。
计数值 控制图则用于以计数值为控制对象的场合 。 离散型的数值,比如,一个产品批的不合格品件数 。 虽然其取值范围是确定的,但取值具有随机性,只有在检验之后才能确定下来 。
计数值控制图的作用与计量值控制图类似,
其目的也是为了分析和控制生产工序的稳定性,
预防不合格品的发生,保证产品质量。
3.控制界限的原理
控制图中的上,下控制界限,一般是用,三倍标准偏差法,(又称 3σ 法 )。 而把中心线确定在被控制对象 (如平均值,极差,中位数等 )的平均值上 。 再以中心线为基准向上或向下量 3倍标准偏差,就确定了上,下控制界限 。 另外,在求各种控制图时,3倍标准偏差并不容易求到,故按统计理论计算出一些近似系数用于各种控制图的计算信息输入表 4-11( 下页 )
表 4-11 计量值控制图计算公式中的系数值表小组观察数目 (n)
A2 D3 D4 m3A2 E2 1/d2
2 1.830 / 3.267 1.880 2.660 0.886
3 1.023 / 2.575 1.187 1.772 0.591
4 0.729 / 2.232 0.796 1.457 0.486
5 0.577 / 2.115 0.691 1.290 0.430
6 0.483 / 2.004 0.549 1.184 0.395
7 0.419 0.076 1.924 0.509 1.109 0.370
8 0.373 0.136 1.864 0.432 1.054 0.351
9 0.337 0.184 1.816 0.412 1.010 0.337
10 0.308 0.223 1.777 0.363 0.945 0.32
例 4-4:某厂生产 φ 10± 0.20毫米的圆柱销,
每隔一定时间随机抽取 5个样品,共取 20组,所得数据 。表 4-12
例 4-4
解,(1)平均值的中心值,
( 2) 根据表 4-15的计算公式求出:
(3)根据 R
( 4)根据以上数据作图并打点。
922.9)136.058.0(001.10
080.10)136.058.0(001.10
2
2 RAxL C L RAxU C L
0 0 1.10?x 13 6.0?R
不必要图的
,
287.0136.011.2
136.0
4L C L RDU C L
RCLR
4.控制图的分析与判断
用控制图识别生产过程的状态,主要是根据样本数据形成的样本点位置以及变化趋势进行分析和判断,判断工序是处于受控状态还是失控状态。
1) 受控状态的判断
工序是否处于受控状态(或稳定状态),其判断的条件有两个:
(a) 在控制界限内的点子排列无缺陷;
(b) 控制图上的所有样本点全部落在控制界限之内。
在满足了条件 (a)的情况下,对于条件 (b),若点子的排列是随机地处于下列情况,则可认为工序处于受控状态 。
(1) 连续 25个点子没有 1点在控制界限以外;
(2) 连续 35个点子中最多有 1点在控制界限以外;
(3) 连续 100个点子中最多有 2点在控制界限以外 。
若过程为正态分布,d为界外点数,则
P(连续 35点,d≤1)
=C035(0.9973)35+ C135(0.9973)34(0.0027)=0.9959
P(连续 35点,d> 1)=1-0.9959=0.0041
于 0.0027位统一数量级的小概率。
同理,
P(连续 100点,d> 2)=0.0026
但是
P(连 25点,d > 0)=0.0654 (有人建议这一判据应划为稳态 )
2) 失控状态的判断只要控制图上的点子出现下列情况时,就可判断工序为失控状态:
(a) 控制图上的点子超出控制界限外或恰好在在界限上; (针对判真为假而言,α越小越好 )
(b) 控制界限内的点子排列方式有缺陷,呈现非随机排列 。 (针对判假为真而言,β越小越好 )
α
β
UCL
CL
LCL
两类错误往往不可避免,α减少而 β减少,反之,
β减少而 α减少。因此,只能根据两类错误造成的总损失最小来确定上下的控制界限。
控制图有缺陷的状态
(1)点子越出控制界限 。
(2)点子在控制界限附近,即在 2σ~3σ之间 。
(称为警戒区间 )
a) 3点中有 2点在警戒区内 ( 0.0053) ;
3σ 2σ
μ●
● ●
●
●
●
●
b) 7点中有 3点在警戒区内;
c) 10点中有 4点在警戒区内。
3σ 2σ
μ●
● ●
●
●
●
●
说明,μ ± 2σ —μ ± 3σ 的概率为 0.0428
μ ± 2σ ——0.9545; μ ± 3σ ——0.9973
连续 3点有 2点在 2σ — 3σ 区间
连续 7点有 3点在 2σ — 3σ 区间
3
2
3
3 0053.0)9973.0()0428.0(
k
kkkcp
7
3
7
7 0024.0)9973.0()0428.0(
k
kkkcp
控制图有缺陷的状态
(3)点子在中心线一侧连续出现 。
a 连续 7点在中心线一侧 。
3σ
μ●
● ●
● ●
-3σ
● ● ● ●
在一侧出现连续 7点的概率为
b 连续 11点中有 10点在中心线一侧;
0 0 7 6 6.0)29 9 7 3.0( 77p
11
1
11
11 0 0 5 9.0)9 9 7 3.0()9 9 7 3.0(
k
kkkcp
c 连续 14点中有 12点在中心线一侧;
d 连续 17点中有 14点在中心线一侧;
e 连续 20点中有 17点在中心线一侧 。
控制图有缺陷的状态
(4)点子有连续上升或下降趋向,如点数 ≥7,
则判断有系统性因素影响 。
(5)点子的波动呈现周期性变化,表明生产过程有系统性因素发生。
-3σ
μ●
● ●
● ●
●
●
●
●
●
5.控制图的两种错误判断
根据控制图的控制界限所作的判断也可能发生错误 。 这种可能的错误有两种:
第一种错误是将正常判为异常;
第二种错误是将异常判为正常。
控制图的两种错误
在生产正常的情况下,点子出界的可能性为 3‰ 。
这数值虽然很小,但这类事件总还不是绝对不能发生的。这样,在纯粹出于偶然点子出界的场合,
我们根据点子出界判断生产过程异常就犯了虚发警报的错误,这种错误就叫做第一种错误。
另有一种情况,即生产过程已经有了异常,产品质量的分布偏离了典型分布,可是总还有一个部分产品的质量特征值是在上下控制界线之内的。
如果我们抽取到这样的产品进行检验,那么,这时由于点子未出界而判断生产过程正常,就犯了漏发警报的错误,这种错误就叫做第二种错误。
控制图应用的预防原则
“20字,,查出异因,采取措施,保证消除,不再出现,纳入标准。
控制图显示异常贯彻 20字控制稳态调整控制界限有无异因有无
控制图上只是打打点时起不到预防作用的。要每贯彻一次,20字,就消除一次异因,使它不再出现,从而达到预防的目的。
一道工序处于稳态成为稳态工序,道道工序处于稳态成为全稳生产线,SPC就是通过全稳生产线达到全过程预防的。
步骤
1)培训
2)确定关键变量(关键质量因素) (美 LTV钢铁公司共确定了 2万个关键变量)
3)提出或改进规格标准 (关键变量分析、填写过程控制标准表)
4)编制控制标准手册 ( 美 LTV钢铁公司编制了 600多本 )
5)进行统计监控
6)对过程进行诊断并采取措施解决问题。( 美 LTV钢铁公司实施
SPC,劳动生产率提高了 20%以上 )
所在车间 控制点 控制因素文件号 日期控制内容过程标准控制理由测量规定数据报告途径控制图 有无建立控制图类型 制定日期 批准日期纠正性措施操作程序审核程序制定者 审批者 审批日期过程控制标准表应用控制图需要考虑的一些问题
1、控制图用于何处?(定量、重复、有统计规律)
2、如何选择控制参数?(特征、有代表性、要求高)
3、怎样选择控制图?(计量、计数)
4、如何分析控制图?(判断前,样品是否随机,读数是否准、计算和描点有无差错)
5、对点子出界或违反规定的处理( 20字、关键要预防)
6、控制图是警铃(判断异常、查原因)
7、控制图的重新制定和保管。
分析用 ~控制图;控制用 ~控制图
分析用:
1、分析生产过程是否处于稳态? ( 调整 → 稳态(统计稳态) )
2、分析生产过程的工序能力是否处于技术要求?
(调整工序能力 → 满足 )
有四种组合的现象
控制用:
当过程达到确定的状态后,才能将分析用的控制图的控制延长线作为控制用控制图。(执行 20字)