您好,欢迎来到飒榕旅游知识分享网。
搜索
您的当前位置:首页概率与统计高考常见题型解题思路及知识点总结

概率与统计高考常见题型解题思路及知识点总结

来源:飒榕旅游知识分享网


概率与统计高考常见题型 解题思路及知识点总结

一、解题思路

(一)解题思路思维导图

(二)常见题型及解题思路

1.正确读取统计图表的信息 解题思路及步骤 理解背景 对选项逐一判断 注意事项 读懂题目所给的背景,理解统计图表各个量的意义 对选项逐一判断,统计图表是否能得出该选项的结论,错误选项一般是概念错误、计算错误、以偏概全的错误等

典例1:(2017全国3卷理科3)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图,根据该折线图,下列结论错误的是( ).

1

A.月接待游客量逐月增加 B.年接待游客量逐年增加

C.各年的月接待游客量高峰期大致在7,8月份

D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳 【解析】由题图可知,2014年8月到9月的月接待游客量在减少,则A选项错误,选A.

2.古典概型概率问题 解题思路及步骤 求基本事件总数m 求事件A包含基本事件个数n 代入公式求概率 注意事项 每个基本事件要求等可能,若是条件概率问题,在有条件则基本事件总数相对减少 确定A包含基本事件个数时要不重不漏 PAmPAB(AB),事件A已经发生的条件下在事件B发生概率PBA nPA(A)典例2:(2018全国2卷理科8)我国数学家陈景润在哥德猜想的研究中取得了世界领先的成果.哥德

猜想是“每个大于2的偶数可以表示为两个素数的和”,如.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是 A.

B.

C.

D.

解:不超过30的素数有2,3,5,7,11,13,17,19,23,29,共10个,随机选取两个不同的数,共有

种方法,因为

法,故概率为

,选C.

,所以随机选取两个不同的数,其和等于30的有3种方

典例3: (2014全国2卷理科5)某地区空气质量监测资料表明,一天的空气质量为优良的概率是0.75,连续两天为优良的概率是0.6,已知某天的空气质量为优良,则随后一天的空气质量为优良的概率是 ( ) A. 0.8 B. 0.75 C. 0.6

D. 0.45

0.6

解:设某天空气质量优良,则随后一天空气质量也优良的概率为p,则据条件概率公式得p=0.75=0.8,故选A.

3.几何概型问题

解题思路及步骤 注意事项 求试验全部结果所构成区域长度(或面积或明确表示实验结果的是一个变量、两个变量还是三个变量,体积) 它们分别用长度(或角度)、面积和体积来表示 求构成事件A的区域长度(或面积或体积) 确定构成事件A的区域长度(或面积或体积) 代入公式求概率

典例4:(2016全国1卷理科4)某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是 ( ) 11A. B. 32 C.

23 D. 34 2

解:如图所示,画出时间轴:

小明到达的时间会随机地落在图中线段AB中,而当他到达时间落在线段AC或DB时,才能保证他等车的时间不超过10分钟,根据几何概型,所求概率P=

10101=.选B. 402

4.类似超几何分布的离散型随机变量分布列问题(古典概型求概率) 解题思路及步骤 写出随机变量可能取值 求出随机变量取每个值的概率 写出分布列 求数学期望 注意事项 明确随机变量取每一个值的意义 “从M个不同元素中不放回抽取(或同时抽取)n个元素”类型概率问题,用古典概型求概率 检验所有概率之和是否等于1 若服从超级和分布X~HN,M,n,则可带入公式ExnM快速求出 N 5.类似二项分布的离散型随机变量分布列问题(频率估计概率,相互事件概率计算) 解题思路及步骤 写出随机变量可能取值 求出随机变量取每个值的概率 写出分布列 求数学期望 注意事项 明确随机变量取每一个值的意义 当有“把频率当成概率或用频率估计概率”条件时,“从M个不同元素中抽出n个元素”类型概率问题就变成相互事件的问题 检验所有概率之和是否等于1 若服从二项分布X~Bn,p,则可带入公式Exnp快速求出 典例5(超几何分布与二项分布辨析):某工厂为检验其所生产的产品的质量,从所生产的产品中随机抽取10件进行抽样检验,检测出有两件次品.

(1)从这10件产品中随机抽取3件,其中次品件数为X,求X分布列和期望;

(2)用频率估计概率,若所生产的产品按每箱100件装箱,从一箱产品中随机抽取3件,其中次品件数为Y,求Y分布列和期望;

(3)用频率估计概率,从所生产的产品中随机抽取3件,其中次品件数为Z,求Z分布列和期望.

分析:第(1)问中,抽取产品的总体N=10,所含次品件数M=2,都是明确的,所以该随机变量的分布为超几何分布。第(2)问是从一箱产品中抽取,产品的总体N=100是明确的,但其中有多少件次品M是不明确的,有的同学根据样本可认为M=20,但违背了题目中的“用频率估计概率”这一条件,或者说没有理解这句话的含义,本质上就是概率的定义没有理解。根据概率定义,“用频率估计概率”这一条件应理解为:从这100件产品中任意抽取1件产品,该件产品是次品的概率是0.2,同时抽取3件等同于不放回抽1件3次,由于每次的概率都是0.2,因此,可以看成重复实验,该随机变量的分布为二项分布。第(3)问是从所生产的全部产品中抽取,而全部产品有多少件题目条件没给出,这时总体N不明确(若总体N明确,就属于第(2)问情况),其中所含次品件数M自然也是不明确的。因此,类似的,在“用频率估计概率”这一条件,该随机变量的分布为二项分布。 解:(1)x的可能取值为0,1,2,根据题意X~H(10、2、3),所以x分布列为:

kC2C82kPXk,(k0,1,2)EX320.62C1010,

(2)Y的可能取值为0,1,2,3,根据题意Y~B(3,0.2),所以Y分布列为:

kPYkC30.2k10.2,(k0,1,2,3),EY30.20.6

3k 3

(3)Z的可能取值为0,1,2,3,根据题意Z~B(3,0.2),所以Z分布列为:

kPZkC30.2k10.2,(k0,1,2,3),EZ30.20.6

3k以上分析用一个表归纳如下: 抽取总体个数N 明确 明确 不明确 从该例以看到,当

总体中所含次品M个数 明确 不明确 不明确 随机变量分布类型 超几何分布 二项分布 二项分布 MM保持不变,若N越大,每次不放回抽取,抽到次品的概率与相差越小,因此,当NNN很大时,超几何分布可以近似看成二项分布。

典例6:据报道,全国很多省市将英语考试作为高考改革的重点,一时间“英语考试该如何改革”引起广泛关注,为了解某地区学生和包括老师、家长在内的社会人士对高考英语改革的看法,某媒体在该地区选择了3000人进行调查,就“是否取消英语听力”问题进行了问卷调查统计,结果如下表: 态度调查人群 在校学生 社会人士 应该取消 2100人 500人 应该保留 120人 𝑥人 无所谓 𝑦人 𝑧人 已知在全体样本中随机抽取1人,抽到持“应该保留”态度的人的概率为0.06.

(1)现用分层抽样的方法在所有参与调查的人中抽取300人进行问卷访谈,问应在持“无所谓”态度的人中抽取多少人?

(2)在持“应该保留”态度的人中,用分层抽样的方法抽取6人,再平均分成两组进行深入交流,求第一组中在校学生人数𝑋的分布列和数学期望.

解:(1)∵抽到持“应该保留”态度的人的概率为0.06,∵

∵持“无所谓”态度的人数为3000−2100−500−120−60=220, ∵应在“无所谓”态度抽取220×

3003000

,解得𝑥=60,

=22人.

(2)由(1)知持“应该保留”态度的一共有180人,

∵在所抽取的6人中,在校学生人数为180×6=4,社会人士人数为180×6=2,于是第一组在校学生人数𝑋的可能取值为1,2,3.𝑃(𝑋=1)=

1𝐶2𝐶423𝐶6

12060

=5,𝑃(𝑋=2)=

4

1

2𝐶1𝐶423𝐶6

=5,𝑃(𝑋=3)=

3

3𝐶0𝐶423𝐶6

=5

1

即𝑋的分布列为:

𝑋 𝑃 1

3

1 1 51

2 3 53 1 5∵𝐸𝑋=1×5+2×5+3×5=2.

典例7(与函数结合):(2018全国1卷理科20)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为

,且各件产品是否为不合格品相互.

(1)记20件产品中恰有2件不合格品的概率为,求的最大值点.

(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的作为的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用. (i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为,求; (ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验? 解:(1)20件产品中恰有2件不合格品的概率为

.令

.因此 ,得

.当

时,

;当

.所以的最大值点为. 时,

. (2)由(1)知,

(i)令表示余下的180件产品中的不合格品件数,依题意知,,即

.所以.

(ii)如果对余下的产品作检验,则这一箱产品所需要的检验费为400元.由于,故应该对余下的产品作检验.

6.其他离散型随机变量分布列问题(频率估计概率,方案选择,随机变量取值意义,与其他知识结合) 解题思路及步骤 注意事项 写出随机变量可能取值 这类题重点考查是否理解随机变量取每一个值的意义 求出随机变量取每个值的概率 注意对随机变量所取的值表示多种的情况,多数情况由频率估计估计概率 写出分布列 检验所有概率之和是否等于1 求数学期望 通过数学期望进行决策 典例8(与函数结合):(2107全国3卷理科18)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间20,25,需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表: 15 20 25 25,30 30,35 35,40 10,15,20, 最高气温 天数 2 16 36 25 7 4 以最高气温位于各区间的频率代替最高气温位于该区间的概率.

(1)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列; (2)设六月份一天销售这种酸奶的利润为Y(单位:元),当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,Y的数学期望达到最大值?

5

解:(1)易知需求量x可取200,300,500,

362216125742;PX500PX200;PX300. 303530353035则分布列为:

X

200 300 500

221

555(2)℃当n≤200时:Yn642n,此时Ymax400,当n200时取到.

4188002n6n8002002n2002n℃当200n≤300时:Y2n, 55555此时Ymax520,当n300时取到. ℃当300n≤500时,

12232002nY2002n20023002n3002n2 5555此时Y520.

℃当n≥500时,易知Y一定小于℃的情况. 综上所述当n300时,Y取到最大值为520.

P

典例9(与数列结合):(2019全国1卷理科21)为了治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得1分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得1分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X. (1)求X的分布列;

(2)若甲药、乙药在试验开始时都赋予4分,pi(i0,1,,8)表示“甲药的累计得分为i时,最终认为甲

,7),其中aP(X1),

药比乙药更有效”的概率,则p00,p81,piapi1bpicpi1(i1,2,bP(X0),cP(X1).假设0.5,0.8.

(i)证明:{pi1pi}(i0,1,2,,7)为等比数列;

(ii)求p4,并根据p4的值解释这种试验方案的合理性.

解:(1)由题意可知X所有可能的取值为:1,0,1

PX11;PX011;PX11

则X的分布列如下:

6

X P (2)

1 0 1 1 0.5,0.8

11 1 a0.50.80.4,b0.50.80.50.20.5,c0.50.20.1

(i)即

piapi1bpicpi1i1,2,,7

pi0.4pi10.5pi0.1pi1i1,2,,7

4pi1pi1i1,2,,7 pi1pi4pipi1i1,2,,7

整理可得:5pipi1pii0,1,2,,7是以p1p0为首项,4为公比的等比数列

(ii)由(i)知:

pi1pip1p04ip14i

p8p7p147,p7p6p146,……,p1p0p140

881441作和可得:p8p0p1404147p1p11

143p13 481144441311 p4p4p0p14444p18414341412570123p4表示最终认为甲药更有效的.由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲

药更有效的概率为p410.0039,此时得出错误结论的概率非常小,说明这种实验方案合理. 257

7.连续型随机变量分布问题——正态分布

解题思路及步骤 注意事项 明确总体的均值和方差 一般用样本的均值和方差估计总体的均值和方差 求随机变量在某范围概率 利用正态密度曲线关于x对称性求概率 典例10:(2107全国1卷理科19)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下

2生产的零件的尺寸服从正态分布N,.

 7

(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在–3,3之外的零件数,求PX1及X的数学期望;

(2)一天内抽检零件中,如果出现了尺寸在–3,3之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. (℃)试说明上述监控生产过程方法的合理性;

(℃)下面是检验员在一天内抽取的16个零件的尺寸:

9.95 10.26

10.12 9.91

9.96 10.13

9.96 10.02

10.01 9.22

9.92 10.04

9.98 10.05

10.04 9.95

116116116222xi9.97,s经计算得x(xx)(x16x)0.212,其中xi为抽取的第ii16i116i116i1i个零件的尺寸,i1,2,,16.

ˆ,用样本标准差s作为的估计值ˆ,利用估计值判断是否需对当天用样本平均数x作为的估计值ˆ3ˆ,ˆ3ˆ之外的数据,用剩下的数据估计和(精确到0.01)的生产过程进行检查?剔除.

附:若随机变量Z服从正态分布N,2,则P–3Z30.9974,0.9974160.9592,

0.0080.09.

3之内的概率为0.9974,落在3,3之外的概率【解析】(1)由题可知尺寸落在3,0为0.0026.PX0C1610.99740.9974160.9592,

0PX11PX010.95920.0408,

0.0026,所以EX160.00260.0416. 由题可知X~B16,3之外的概率为0.0026,由正态分布知尺寸落在3,3之外(2)(i)尺寸落在3,为小概率事件,因此上述监控生产过程的方法合理.

(ii)39.9730.2129.334,39.9730.21210.606,

10.606,因为9.229.334,10.606,所以需对当天的生产过程检查. 因此剔3,39.334,9.97169.2210.02. 除9.22,剔除数据之后:15222222[9.9510.0210.1210.029.9610.029.9610.0210.0110.02

9.9210.0229.9810.0210.0410.0210.2610.029.9110.02

2222210.1310.02

10.0210.0210.0410.0210.0510.029.9510.02]222210.008所以150.0080.09.

8

8.最小二乘法求两个线性变量的回归方程问题 解题思路及步骤 画散点图 求x和y 注意事项 若样本点大致分布在一条直线附近,则可判断两个变量具有线性相关,若题设已知两个变量线性相关,可省略该步骤 准确计算x和y 根据样本数据特点合理选用公式计算,若各数据与平均数差的有效数学字比原数据少,则选用作差再相乘的公式 运算结果保留两位小数位数应与题目要求 ˆ 列表计算bˆ,写出回归方程 求a 典例11:(2016全国3卷理科18)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.

注:年份代码1-7分别对应年份2008-2014.

(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明.

(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注:

777参考数据: yi=9.32, tiyi=40.17,i1i1(yi1iy)2 =0.55,7≈2.6.

参考公式:相关系数r=ti1nnityiy回归方程yabt中斜率和截距的最小二乘估计公式

n(ti1it)2(yi1iy)2

分别为:bti1nintyiy,a=y-bt

i(ti1t)2解:(1)由折线图中的数据和附注中参考数据得

t4,tit28,27ti17i1yi1ii7iy0.55.27ityiy7tyi1tyi1i40.1749.322.,

2.所以r0.99.0.5522.6因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.

9

9.32(2)由y=1.331及(1)得b7ti17ityiyiti17t22.≈0.103, 28a=y-bt≈1.331-0.103×4≈0.92.所以,y关于t的回归方程为y=0.92+0.10t.

将2016年对应的t=9代入回归方程得:y=0.92+0.10×9=1.82. 所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.

9.两个变量通过换元可转化为线性相关问题 解题思路及步骤 画散点图 注意事项 根据样本点分布情况确定两个变量适用的函数模型,若题设已知两个变量的函数模型,可省略该步骤 通过换元,使得换元后的两个变量线性相关(一次函数关系) 用最小二乘法求线性回归方程 还原为原来两个变量的回归方程 换元 求线性回归程 还原 典例12:(2015全国1卷理科19)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.

x̅ 46.6 y̅ 563 18w̅ 6.8 8i=1

i=1∑8(xi-x̅)2 2.8 i=1∑8(wi-w̅)2 1.6 i=1∑(xi-x̅)(yi-y̅) 1 469 8i=1∑(wi-w̅)(yi-y̅) 108.8 8表中wi=√xi,w̅=∑wi.

(1)根据散点图判断,y=a+bx与y=c+d√x哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)

(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程.

(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题: ℃年宣传费x=49时,年销售量及年利润的预报值是多少? ℃年宣传费x为何值时,年利润的预报值最大?

附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归线v=α+βu的斜率和截距的最小二乘估计分别为:=i=1n

10

̅)(vi−v̅)∑(ui−u

i=1n

̅)2∑(ui−u

,=v̅-u̅.

解:(1)由散点图的变化趋势可以判断,y=c+d√x适宜作为年销售量y关于年宣传费x的回归方程类型.

ˆ(2)令w=√x,先建立y关于w的线性回归方程.由于d(ww)(yy)iii(ww)ii. .=y̅-w̅=563-68×6.8=100.6,所以y关于w的线性回归方程为=100.6+68w,因此y关于x的回归方程为=100.6+68√x.

(3)℃由(2)知,当x=49时,年销售量y的预报值=100.6+68√49=576.6,年利润z的预报值=576.6×0.2-49=66.32. ℃根据(2)的结果知,年利润z的预报值,=0.2(100.6+68√x)-x=-x+13.6√x+20.12.所以当√x=时,取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.

10.两个分类变量是否有关的性检验问题 解题思路及步骤 2×2列联表 计算卡方 注意事项 注意是用样本数据而不是总体数据 注意运算策略,处理分子的交叉相乘时应先提公因式,平方数写成乘积形式再约分,最后除法运算保留三位小数 要根据题设中的百分比找对应的经验值做比较 根据比较结果,把结论完整的表述出来,不能只是说有关或无关 13.62

=6.8,即x=46.24

比较经验值 下结论

典例13:(2018全国3卷理科18)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:

(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;

(2)求40名工人完成生产任务所需时间的中位数,并将完成生产任务所需时间超过和不超过的工人数填入下面的列联表: 第一种生产方式 第二种生产方式 超过 不超过 (3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:

11

解:(1)第二种生产方式的效率更高.理由如下:

(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.

(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.

(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.

(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.

12

二、知识点总结 (一)知识点思维导图

13

(二)常用定理、公式及其变形

1.用样本的数字特征估计总体的数字特征 (1)样本本均值:xx1x2xn

n2222(xx)(xx)(xx)12n (2)样本标准差:ssn(3)频率分布直方图估算样本众数、中位数、平均数 ①众数:最高小矩形中点值; ②中位数:先确定中位数所在小组,设中位数为m,由直线x=m两侧小矩形面积之和等于0.5列方程求m. ③平均数:各小矩形中点值与其面积的积的和.

2.随机事件的概率及概率的意义

(1)随机事件:在条件S下可能发生也可能不发生的事件,叫相对于条件S的随机事件;

(2)概率定义:在相同的条件S下重复n次试验,观察某一事件A是否出现,称n次试验中事件A出现的次数nA为事件A出现的频数;称事件A出现的比例fn(A)=

nAn为事件A出现的频率:对于给定的随机事

件A,如果随着试验次数的增加,事件A发生的频率fn(A)稳定在某个常数上,把这个常数记作P(A),称为事件A的概率. 3.概率的基本性质

(1)事件的包含、并事件、交事件、相等事件

(2)若A∩B为不可能事件,即A∩B=ф,那么称事件A与事件B互斥;

(3)若A∩B为不可能事件,A℃B为必然事件,那么称事件A与事件B互为对立事件;

(4)当事件A与B互斥时,满足加法公式:P(A℃B)= P(A)+ P(B);若事件A与B为对立事件,则A℃B为必然事件,所以P(A℃B)= P(A)+ P(B)=1,于是有P(A)=1—P(B) 4.古典概型及随机数的产生

(1)古典概型的使用条件:试验结果的有限性和所有结果的等可能性.

A包含的基本事件数 (2)公式P(A)=

总的基本事件个数5.几何概型及均匀随机数的产生

(1)几何概率模型:如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型;

构成事件A的区域长度(面积或体积)(2)公式:P(A)=.

试验的全部结果所构成的区域长度(面积或体积)6.随机变量:如果随机试验可能出现的结果可以用一个变量X来表示,并且X是随着试验的结果的不同而变化,那么这样的变量叫做随机变量. 随机变量常用大写字母X、Y等或希腊字母 ξ、η等表示. 7.离散型随机变量的分布列:一般的,设离散型随机变量X可能取的值为x1,x2,..... ,xi ,......,xn.

X取每一个值 xi(i=1,2,......)的概率P(ξ=xi)=Pi,则称表为离散型随机变量X 的概率分布,简称分布列

分布列性质:

℃ pi≥0, i =1,2, … ; ℃ p1 + p2 +…+pn= 1.

14

9.条件概率:对任意事件A和事件B,在已知事件A发生的条件下事件B发生的概率,叫做条件概率.记作P(B|A),读作A发生的条件下B的概率公式:P(B|A)P(AB),P(A)0. P(A)10.相互事件:事件A(或B)是否发生对事件B(或A)发生的概率没有影响,这样的两个事件叫做相互事件,P(AB)P(A)P(B)

12.数学期望:一般地,若离散型随机变量ξ的概率分布为

则称 Eξ=x1p1+x2p2+…+xnpn 为ξ的数学期望或平均数、均值,数学期望又简称为期望.是离散型随机变量.

13.方差:D(ξ)=(x1-Eξ)2·P1+(x2-Eξ)2·P2 +......+(xn-Eξ)2·Pn 叫随机变量ξ的均方差,简称方差. 14.正态分布:

12(1)定义:若概率密度曲线就是或近似地是函数 f(x)e2,x(,)

2(0)是参数,分别表示总体的平均数与标准差.则其分布叫正态分的图象,其中解析式中的实数、布记作:N(,),f( x )的图象称为正态曲线; (2)基本性质:

℃曲线在x轴的上方,与x轴不相交;

℃曲线关于直线x=对称,且在x=时位于最高点;

越大,℃当一定时,曲线的形状由确定.曲线越“矮胖”;

表示总体的分布越分散;越小,曲线越“瘦高”,表示总体的分布越集中;

℃正态曲线下的总面积等于1. 15.3原则:

从上表看到,正态总体在 (2,2)以外取值的概率只有4.6%,在 (3,3)以外取值的概率只有0.3% 由于这些概率很小,通常称这些情况发生为小概率事件.也就是说,通常认为这些情况在一次试验中几乎是不可能发生的.

(x)2 15

17.回归分析

16

17

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- sarr.cn 版权所有 赣ICP备2024042794号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务