不良率 1%,就一定会抽到 1 个不良品吗?
在生产与品控工作中,我们常会碰到这样的疑问:
“ 倘若工程不良率为 1% ,那抽取 100 个样本,是不是必然能抽到 1 个不良品呢? ”
不少同行都秉持着这样的想法。他们坚信,既然不良率是 1% ,那么抽 100 个样本 “ 理应 ” 能发现 1 个不良品,抽 200 个 “ 理应 ” 能找到 2 个。这看起来似乎合情合理,但实际上,这是一个非常典型的统计认知误区!
今天,我们就来探讨抽样检验的正确方法,带你从统计学的角度,科学地估算 “ 究竟需要抽取多少个样本,才能确保抽到 1 个不良品 ” 。
一、直觉≠概率:为何 100 个样本未必能抽到不良品?
首先,我们要纠正一个常见的错误认知:
不良率为 1% ,并不意味着每 100 个产品中就 “ 平均地 ” 分布着 1 个不良品。
我们所面对的是随机事件,每一次抽样都存在不确定性。用统计学的语言来讲,这种情况符合二项分布模型。
在不良率固定为 p=0.01 的条件下,抽取 n 个样本,抽到 k 个不良品的概率可通过以下公式计算:
P(k) = C(n, k) × p^k × (1-p)^(n-k)
这意味着:当你抽取 100 个样本时,有可能一个不良品都抽不到,也有可能抽到 2 个,甚至 3 个。这就是 “ 概率 ” 而非 “ 必然 ” 。
二、若想“有把握” 抽到不良品,应抽取多少个样本?
这就需要引入另一个核心概念 —— 置信水平 。
假设你希望有 95% 的把握能抽到至少 1 个不良品,那么我们就要从概率的角度进行计算。
我们需要先明确:抽取 n 个样本时,一个不良品都没有的概率是多少?这个概率为: P (0 个不良 ) = (1 - p)^n
而我们实际需要的是: P ( 至少 1 个不良 ) ≥ 95%
换算成公式就是: 1 - (1 - p)^n ≥ 0.95
将 p = 0.01 代入,解这个不等式就能得出 n 的值:
(1 - 0.01)^n ≤ 0.05
0.99^n ≤ 0.05
n ≥ log(0.05) / log(0.99) ≈ 298
结论 :如果想有 95% 的信心抽到至少 1 个不良品,样本量需要达到 298 个,而非 100 个!
三、想“更精确” 地估计不良率?需关注置信区间
另一个常见的问题是:抽样之后,不良率的估计能达到多高的精确度?
这时我们就要用到置信区间公式。对于大样本而言, 样本不良率 的置信区间计算如下:
置信区间 = 样本不良率 ± z×√[ 样本不良率 ×(1 - 样本不良率 )/n]
其中:
• z 代表标准正态分布的分位数,例如在 95% 的置信水平下, z=1.96 ;
• n 为样本量;
• 公式中的后半部分可理解为可接受的误差范围 E 。
若你希望估计的不良率误差不超过 ±0.5% ,在 95% 的置信水平下,需要多少样本呢?
代入公式计算:
n = (1.96² × 0.01 × (1 - 0.01)) / 0.005² ≈ 1522
若你可以接受 ±1% 的误差,样本量则会降至:
n ≈ 381
这也印证了我们常说的: “ 精度越高、置信度越强,所需的样本量就越大。 ”
四、风险管理:不可忽视的抽样陷阱
在实际的抽样方案中,还需要考虑两个关键风险:
• α 风险(生产方风险) : 合格品被误判为不合格品,可能导致合格批次被错误拒收,增加生产方的成本与损失;
• β 风险(使用方风险) : 不合格品被误判为合格品,可能导致不合格批次流入市场,影响使用方的质量体验与利益。
合理的抽样方案必须平衡这两种风险。例如 AQL (接受质量限)抽样法,就是在这两种风险之间寻求最优解决方案,通过明确可接受的质量水平,既保护生产方的合理利益,也保障使用方的质量需求。
五、回到最初的问题
不良率 1% 时,抽取 100 个样本能抽到 1 个不良品吗?
答案是: 不一定!
• 抽取 100 个样本,只有约 63% 的概率能抽到至少 1 个不良品;
• 若要以 95% 的概率抽到 1 个不良品,需要抽取 298 个样本;
• 若要将不良率的估计误差控制在 ±0.5% 以内,则需要抽取 1522 个样本。
统计学并非魔法,但它是帮助我们做出科学决策的有力工具。
希望通过今天的分享,能让你在制定抽样计划时,不再仅凭感觉,而是依靠数据和概率来做出判断,让品控工作更精准、更高效!
● 资料丨ISO9001质量管理体系流程图(附程序文件下载)