一、概率论基础知识
许多决策都是在不确定的情况下做出的。例如,测量方法是否正确?过程能力能否达到要求?接收到的产品是否满足预定的合格率要求?利用概率论可以解决这一系列问题,下面来明确概率的一些基本概念。
1.随机试验和随机事件
在同一组条件下,对某事物或现象所进行的观察或实验称为试验,把观察或实验的结果称为事件。广义上讲,从某一研究目的出发,对随机现象进行观察均称为随机试验,但严格意义上的随机试验应该满足三个条件:
(1)试验可以在相同的条件下重复进行。
(2)试验的所有可能结果是明确可知的,并且不止一个。
(3)每次试验总是恰好出现这些可能结果中的一个,但试验前不能肯定这次试验会出现哪个结果。
随机事件就是随机试验中可能出现也可能不出现的事件。特别地,每次随机试验一定出现的事件称为必然事件,一定不会出现的事件称为不可能事件。
2.事件间的关系与运算
(1)事件的包含与相等。
如果事件A出现一定导致事件B出现,则称事件A包含于事件B,用记号ACB表示(见图4--6)。例如,“电话交换台一分钟内接到的电话呼叫恰为指定次数”是一个随机事件,可能是0,1,2,…。“接到呼叫2次”和“接到呼叫不超过5次”这两个事件有明显的关系,前者发生,后者一定发生,前者包含于后者,或者说后者包含了前者。如果ACB同时BCA,则称事件A与事件B相等,用记号A=B表示。
(2)事件不相容。
事件A与事件B没有共同的样本点,则称事件A与事件B不相容或称事件A与事件B是互斥事件(见图4—7)。例如,掷骰子时,出现1个点和出现2个点的结果不可能同时出现,即“出现1个点”和“出现2个点”是互斥事件。检查一批产品,“恰有1件不合格品”和“恰有2件不合格品”是互斥事件。呼叫中心的客服人员“在5分钟内接到过电话”和“在5分钟内未接到电话”是互斥事件。
(3)事件的并。
由事件A与事件B中所有样本点组成的新事件称为事件A与事件B的并,记为AUB,是逻辑上“或”的关系(见图4-8)。例如,在学校某一个班级内抽签,A=“班干部”,B=“女生”,则AUB=“班干部或女生”;在电话交换台,A=“接到呼叫1次”,B=“接到呼叫2次”,则AUB=“接到呼叫1次或2次”。
(4)事件的交。
由事件A与事件B中公共的样本点组成的新事件称为事件A与事件B的交,记为AOB或AB,是逻辑上“与”的关系(见图4-9)。例如,在一个班级内抽签,A=“班干部”,B=“女生”,则AnB=“班干部并且是女生”;在电话交换台,A=“接到呼叫多于3次”,B=“接到呼叫少于5次”,则ANB=“接到呼叫4次”。
(5)事件的差。
由在事件A中而不是在事件B中的样本点组成的新事件称为事件A对事件B的差,记为A-B(见图4-10),同理可知B-A(见图4-11)。仍以在一个班级内抽签为例,A=“班干部”,B=“女生”,则A-B=“班干部但不是女生”;B-A=“女生但不是班干部”。在电话交换台,A=“接到呼叫多于3次”,B=“接到呼叫少于5次”,则A-B=“接到呼叫多于4次”,B-A=“接到呼叫少于4次”。
(6)对立事件。
假设所有的事件构成样本空间为Q,在Q中而不在事件A中的样本点组成的事件称为事件A的对立事件,记为A(见图4—12)。例如,检查布匹时,事件A“至少有1个疵点”的对立事件A是“没有疵点”。
3.概率
概率是对一个事件发生的可能性大小的度量,表示事件A发生可能性的数值P(A)称为事件A的概率。抛掷一枚质地均匀的硬币,“正面朝上”与“背面朝上”的可能性各为1/2。抛掷骰子时,“恰为6点”的可能性为1/6。概率是一个介于0~1的数,概率越大,事件发生的可能性越大;概率越小,事件发生的可能性越小。不可能事件的概率为0,必然事件的概率为1。
4.概率的性质和运算法则
概率具有以下基本性质。
性质1:对任一随机事件A,有0≤P(A)≤1。
不可能事件的概率为0,必然事件的概率为1,即P()=0,P(Q)=1。例如抛掷骰子时,出现任何点数的概率p都是一个大于0小于1的正数。
性质2:事件A的对立事件为A,有P(A)+P(A)=1。
例如,抛掷骰子,事件A=“出现点数3”,则A=“不出现点数3”,所以P(A)+P(A)=1,它表示抛掷骰子时,出现的点数要么是3要么不是3。
性质3:若AつB,则P(A-B)=P(A)-P(B)。
例如,抛掷骰子,事件A=“出现点数小于3”,事件B=“出现点数1”,则AつB,所以P(A-B)=P(A)-P(B)。
性质4:加法法则。
事件A与事件B的并的概率为P(AUB)=P(A)+P(B)-P(AB)。当事件A与事件B不相容时,P(AB)=O,则P(AUB)=P(A)+P(B)。
例如,抛掷骰子,事件A=“出现点数小于5”,事件B=“出现点数大于3”,则AUB=“出现点数为1~6中的任意一个数”,事件AB=“出现点数4”,所以P(AUB=P(A)+P(B)-P(AB)=4/6+3/6-1/6=1。当事件A=“出现点数小于2”,事件B=“出现点数大于5”时,事件A和事件B不相容,即P(AB)=0,所以P(AUB)=P(A)+P(B)=1/6+1/6=2/6
此性质可推广到多个两两互不相容的随机事件A1,A2,…,An,则P(A1UA2U…UAn)=P(A1)+P(A2)+…+P(Am)
性质5:乘法法则。
对任意两个事件A与B,有P(AB)=P(B|A)P(A)=P(A|B)P(B),其中P(A|B)为事件B发生条件下事件A发生的条件概率,此时要求P(B)>0。
例如,投掷骰子时,事件A=“出现点数大于2”,事件B=“出现点数小于4”,则P(A)=,P(B)=。当事件A发生时,即出现点数为3,4,5或6,此时事件B也发生的条件概率为P(B|A)=1,所以P(AB)=P(B|A)P(A)=1/4×4/6=1/6。同理可得,P(AB)=P(A|B)P(B)=1×品=,即P(AB)=P(B|A)P(A)=P(A|B)P(B)=1/6。
当两个事件的发生互不影响,则称这两个事件相互独立,即P(A|B)=P(A),P(B|A)=P(B),此时乘法原则简化为:P(AB)=P(A)P(B)。
二、随机变量及分布
1.随机变量
因此,随机变量,即按照一定的概率取值的变量,通常用大写字母X,Y,Z等表示,而随机变量的取值通常用小写字母x,y,z等表示。随机变量通常具有以下两个特征:
(1)取值的随机性,即事先不能确定X取哪个值。
(2)取值的统计规律性,即可确定X取某个数值或X在某一区间内取值的概率。
通常我们只研究两类随机变量:离散型随机变量和连续型随机变量。
2.离散型随机变量和分布
如果随机变量X所有可取值集合只包括有限或可列个元素集合,则X为离散型随机变量。如抛硬币得到正或反面的次数、铸件上的缺陷数等都是离散型随机变量。其中:P(X=xi)=pi为离散型随机变量X的概率函数。其分布列表如下:
3.连续型随机变量和分布
如果随机变量X能在一个数值区间内取任何值,则X为连续型随机变量。如灯泡、电视机等电器的使用寿命等都是连续型随机变量。对于连续型随机变量,我们一般用概率密度函数来表示其分布情况。假设
其中,随机变量X小于或等于实数x的概率F(x)=P(X≤x),则有
F(x)又称为累积分布函数或分布函数,如图4-15阴影部分所示。
由于在计算面积时,直线的面积为0,即P(X=a)=0,所以有
指数分布是一种常见的连续分布,其概率密度函数为:
式中,A>0,为参数。在工程实践中,不少产品首次发生故障的时间,或发生故障后需要维修的时间都服从指数分布。
三、数学期望、均值及方差
均值(mean)、方差(variance)与标准差(standard deviation)均为描述数据分布状况的重要指标。均值用来表示分布的中心位置,反映分布的集中情况,用E(X)表示。均值的计算公式为:
很多情况下仅了解集中程度是不够的,还必须了解随机变量的离散特征。我们通常使用方差度量分布的离散程度,记方差为Var(X),其计算公式如下:
标准差σ是方差Var(X)的正平方根,与变量X具有相同的单位,也用来反映离散程度的大小,记为σ=σ(X)=Var(X)。
均值与方差具有以下性质:
(1)设X为随机变量,a与b为任意实数,则有E(aX+b)=aE(X)+b,var(ax+b)= a2var(x)的值。
(2)对任意两个随机变量X1和X2,有E(X1+X2)=E(X1)+E(X2);如果X1和X2独立,则有Var(X1土X2)=Var(X1)+Var(X2)。
四、常用的离散分布
常用的离散分布有:
●0-1分布(0-1分布).
●二项分布(二项分布).
●执行下列操作吴成祖(鱼的分布)。
●超几何分布(超几何分布).
1. 0-1分布
当每次试验中,只有两种可能的结果,例如正面朝上与背面朝上,产品合格与不合格,检验通过与不通过,目标命中与不命中,具备某特性与不具备某特性等,或是只关注试验的两种不同结果,例如手机月话费是否高于100元,布匹疵点数是否多于5个等,可以将这两种结果称为成功与失败。若成功的概率为p,则失败的概率为1-p,设随机变量X表示“试验的结果”,则X服从两点分布。若把成功记为1,失败记为0,则称X服从0-1分布,记为X~B(1,p)。
0—1分布的均值、方差与标准差分别为:
五、常用的连续分布
常见的连续分布有:
正态分布;
均匀分布;
指数分布;
对数正态分布;
威布尔分布。
正态分布
质量管理中最常用的连续分布是正态分布,它能够描述很多质量特性随机取值的统计规律性。正态分布的概率密度函数为:
2.均匀分布
设连续随机变量X具有概率密度函数为:
则称X在区间(a,b)上服从均匀分布,记为X~U(a,b),如图4—24所示。如果变量X在区间(a,b)上服从均匀分布,意味着X落在区间(a,b)中任意长度相同的子区间内的可能性相同。均匀分布U(a,b)的均值、方差与标准差分别为:
3.指数分布
设连续型随机变量X的概率密度函数为:
在地质勘探中,岩石的某种化学成分的对数服从正态分布,故得名对数正态分布。对数正态分布出现在很多领域,如针刺麻醉的阵痛效果、英语单词的长度、流行病的蔓延时间、某些电器的寿命、化学反应时间、绝缘材料的被击穿时间、产品维修时间,等等。
5.威布尔分布
威布尔分布在可靠性工程中广泛应用,尤其适用于机电类产品的磨损累计失效的分布形式。由于可以利用概率纸很容易地推断出它的分布参数,所以广泛应用于各种寿命试验的数据处理。其概率密度函数为:
六、中心极限定理
假设随机变量X1和X2相互独立,且X1和X2同分布,即X1和X2具有相同的分布形状和分布参数,则称X1和X2是独立同分布的随机变量。
当Xi的分布对称时,只要n≥5近似效果就比较理想;当Xi的分布非对称时,一般n≥30近似效果才比较理想。根据中心极限定理,可用多次测量的方法对样本均值进行更精确的估计。
天行健咨询16年来专注提供精益生产管理、精益设计、六西格玛、精益六西格玛、六西格玛设计(DFSS)、TRIZ研发管理等公开课培训、企业内训、项目辅导咨询服务!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.