内容正文:
考点09 数字特征与概率的计算问题
概率与统计,是历年高考的必考点,尤其是新高考改革后,各卷都有考查,其主要考查内容有:数字特征与概率的计算问题、随机变量的均值与方差、回归分析与独立性检验、二项分布及其应用等。例如:2021年全国高考甲卷(文)、(理)[17],2022年全国新高考卷Ⅰ[20],2022年全国乙卷(文)、(理)[19],2022年全国甲卷(文)[17]等都对数字特征与概率的计算问题进行了考查。
〔1〕样本的数字特征:
1.众数、中位数、平均数
众数:在一组数据中,出现次数最多的数据叫作这组数据的众数.
中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或者最中间两个数据的平均数)叫作这组数据的中位数.
平均数:.
2.样本方差、样本标准差
标准差,其中是样本数据的第i项,n是样本容量,是平均数。标准差是反映数据总体波动大小的特征数,样本方差是样本标准差的平方。
3.在频率分布直方图中,每个小矩形的面积就是数据在对应区间的频率,所有小矩形的面积之和为1,这是解题的关键,也是识图的基础.准确理解频率分布直方图的特点,频率分布直方图中纵轴上的数据是各组对应的频率除以组距,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆。
〔2〕概率计算:
1.古典概型:
2.互斥事件与对立事件:若事件A与事件B互斥,则P(A∪B)=P(A)+P(B),若事件A与事件B互为对立事件,则P(A)+P(B)=1。
3.相互独立事件:若事件A与事件B相互独立,则P(AB)=P(A)P(B)。
4.条件概率问题的解题步骤:第一步,判断是否为条件概率,若题目中出现“在······条件下”“在······前提下”等字眼,一般为条件概率;题目中若没有出现上述字眼,但已知事件的发生影响所求事件发生的概率时,也需注意是否为条件概率。第二步,利用公式计算概率,若事件A与事件B相互独立,且P(A)>0,则P(B|A)=P(B)。
5.全概率公式:,,,……,是一组两两互斥的事件,∪∪……∪=,且,i=1,2,……,n,则对任意的事件B⊆Ω,有。
例1.(2022年全国乙卷(文)、(理)·19)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
样本号i
1
2
3
4
5
6
7
8
9
10
总和
根部横截面积
0.04
0.06
0.04
0.08
0.08
0.05
0.05
0.07
0.07
0.06
0.6
材积量
0.25
0.40
0.22
0.54
0.51
0.34
0.36
0.46
0.42
0.40
3.9
并计算得.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数.
例2.(2022·全国·高考甲卷(文)·17)甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:
准点班次数
未准点班次数
A
240
20
B
210
30
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?
附:,
0.100
0.050
0.010
2.706
3.841
6.635
1.(2022·广西·模拟预测(理))某学校共有1000名学生参加数学知识竞赛,其中男生200人.为了了解该校学生在数学知识竞赛中的情况,采取按性别分层抽样,随机抽取了100名学生进行调查,分数分布在450~950分之间.将分数不低于750分的学生称为“高分选手”.根据调查的结果绘制的学生分数频率分布直方图如图所示.
(1)求的值,并估计该校学生分数的平均数(同一组中的数据用该组区间的中点值作代表);
(2)若样本中属于“高分选手”的男生有10人,完成下列列联表,并判断是否有99.5%的把握认为该校学生属于“高分选手”与“性别”有关.
属于“高分选手”
不属于“高分选手”
合计
男生
女生
合计
参考公式:,其中.
0.15
0.10
0.05
0.025
0.010
0.