散点图(Scatter Diagram)
散点图用来研究两个变量之间可能的因果关系。散点图并不能证明一个变量是另一个变量产生的原因,但它可以证明两个变量是否相关联以及相关的强弱。
散点图的横坐标代表第一个变量,纵坐标代表第二个变量。一个典型的散点图如下:
散点图中的点形成一个集群的形式,集群点的方向和密度表明变量1和变量2的相关性强弱。这个集群越是像一条直线,这两个变量的相关性就越强。如果它是一条直线的话,每一次一个变量变化,另一个变量也会发生同样的变化。
人员 | 体重 | 身高 |
1 | 160 lbs | 70 inches |
2 | 180 " | 61 " |
3 | 220 " | 75 " |
. | . | . |
. | . | . |
50 | 105 | 61 " |
2) 画出图形的横轴和纵轴,从左到右从下到上数值逐渐增大。通常表示变化原因的变量用横轴表示,表示结果的变量用纵轴表示;
3)在图上标点,如果有重复的点,在第一点上画圈表示第二点,在第一个圈上再画圈表示第三点,以此类推,最终的散点图如下:
下面是常见的散点图的类型及其意义:
Scatter Diagram—Mfg. Example
Active Ingredient Stability
Scatter Diagram—Admin./Service Example
Overtime/# Of Billing Errors
散点图理解/绘制要点:
● 一个负相关(当x减小时y增大)同正相关(当x增大时,y增大)同样重要;
● 只能说x和y相关,但不能说一个变量产生了另一个;
● 这部分的例子都是基于线性相关的:y = a + bx。然而,日常遇到的并不仅仅这一种相关性,还有其他的例如,
等相关类型。
● 另外还有精确的测试相关性的统计方法,但不在本书的范围之内。
控制图(Control Chart)
当我们在趋势图上加多一条在均值线上边的由统计数值决定的上限线(Upper Control Limit)和一条下限线(Lower Control Limit)时,这个趋势图就变成了控制图。
这些控制线是先通过对一个没有异常变化的过程进行取样,对样本进行统计分析而得出。将样本控制线画到图上来判断每个点是否在控制线之外或是有不正常的情况。如果有上述情况发生,就称过程为“失控”。
在控制线之内的点的周期波动,来自系统内的正常因素(系统设计、设备选择、预防性维护等),只能通过改变系统来影响;控制线之外的点来自偶然因素(人为失误、突发事件等),是过程正常运行是不应当出现的。在应用控制图作为监测工具时,必须先消除掉偶然因素。消除掉偶然因素以后,过程就是受控的,就可以在固定的间隔时间内取样来保证过程没有根本性的变化。
记住:“控制”并不一定意味着产品或服务满足要求,它只是说明过程处于稳定状态(也许差的稳定状态)。例如:
在这个例子中,过程是受控的,但是它并没有达到规范。控制图左边的曲线显示规范的界限比控制图的界限更狭窄。不管是改进过程还是降低规范,只要记住规范是理想的需要,控制界限是过程稳定状态的实际能力。
制作控制图的方法及主要公式:
所谓计量值控制图,是指控制图所依据的数据均属于由量具实际测量出来的,如长度、重量、时间等,具有连续性。
首先计算每个子样本的平均值()和全距(R):
R=-
n为子样本的观察值数量.
计算流程的平均全距()以及总平均数(
):
k为子样本个数.
计算控制界限:
Table of | |||
Number of observations in subgroup (n) | Factors for X Chart | Factors for R Chart | |
A2 | Lower D3 | Upper D4 | |
2 | 1.88 | 0 | 3.268 |
3 | 1.023 | 0 | 2.574 |
4 | 0.729 | 0 | 2.282 |
5 | 0.577 | 0 | 2.114 |
6 | 0.483 | 0 | 2.004 |
7 | 0.419 | 0.076 | 1.924 |
8 | 0.373 | 0.136 | 1.864 |
9 | 0.337 | 0.184 | 1.816 |
10 | 0.308 | 0.223 | 1.777 |
2) 计数值控制图
所谓计数值控制图是指控制图依据的数据均属于以单位个数或次数统计出来的,如不良品、不良率、疵点数、疵点率等,主要有以下4种:
P=