内容正文:
决赛”为事件B,则P(A)=,
3
P(B)=3
1
因为每个人是否进入歌手大赛决赛和
达人秀决赛互不影响,
所以事件A和事件B相互独立,
所以甲两个比赛都进入决赛的概率为
3
4
故甲两个比赛都进入决赛的概率
(2)X的可能取值为0,1,2,3,且
X~B,)
则P(X=0)=
c()()-
27
4
P(X=1)=
c()广()
64
P(X=2)=
c()'()
64
P(X=3)=
c()广()
二64
故随机变量X的分布列为
X
0
1
3
27
27
9
1
P
64
64
64
64
所以E(X)=0X
27
+1×
27
+2×
64
64
3
6+3×6
41
例3解:(1)由题意知,X所有可能的取
值为1,2,3,4,
CC
P(X=1)=
30
CC
P(X=2)=
3
C1。
CC
1
P(X=3)=
Clo
P(X=4)=
二6
所以X的分布列为
X
1
3
1
3
1
1
30
10
2
6
(2)X的期望E(X)=1×30+2×
3
1
14
0+3×2+4×6=5
又E(X)=1×
1
30+4X+9×2
十
42
16×6
5
故方差D(X)=E(X)-(E(X))
对点训练3解:(1)由题意易知X的可
能取值为0,1,2,3,
则p(X=o)=C
=19P(X=
1)=
CoCi。
C2o
15,P(x=2)=
38
C1。C1.1
38P(X=3)=
2
C。
19'
则X的分布列为
X
0
1
2
3
2
15
15
P
2
19383819
(2)由题意易知的可能取值为0,1,
2,3,4,
21
则P(=0)=
16
=87P(=1)=
C×23
C×22
31
31
87=27,P(g=3)=
24
8
8
31
P(=4)=
C
1
31
=81
则专的分布列为
0
2
3
16
32
8
8
P
8181278181
例4AD观察题图可以看出,甲地数学
平均分为90,小于乙地数学的平均分
100,A正确:题图中还可以看出乙地数
据更加集中,故乙地方差更小,B错误;
根据对称性,P(90≤X<94)=
P(86<X≤90)<P(82≤X<90),
C错误;o2=8时,根据题千数据,
P(92Y≤108)≈0.6827,根据对称
性,P(92<Y≤10)≈0.6827,另有
2
P(76Y≤124)≈0.9973,根据对称
性,P10<Y≤124≈0.9973,于是
2
P(92Y<124)
0.9973+0.6827
2
0.84,D正确.故选AD.
对点训练4(1)3
解析:由题意可知,正态曲线的对称轴
为直线x=1,由正态曲线的对称性可
得a+a21=2>a=
5
2
(2)8
解析:由题意可知,正态曲线关于直线
x=10对称,所以P(x>17)=
P(x<3)=m,所以m十n=2,因为
m2十n2≥2mn,得2(m2十n2)≥m2+
n+2n,得m2十n≥之(m十n)
×()=,当且仅当m=n
1
年时等号成立,所以m十的最小值
为8
例50.1359
解析:因为X~N(100,2),即4=
100,0=2,所以P(102≤X≤104)=
P(十g≤X≤十2a)=2X
1
[P(u-2G≤X≤h+2G)-P(u-
0X以十6)]≈
0.9545-0.6827=0.1359.即这名
学生数学成绩在区间[102,104]内的
概率约为0.1359.
对点训练5①②
解析:对于①,因为P(Y>45)=
z1-P(21≤Y≤45)]≈2×1-
0.9973)=0.00135,即乘坐线路B,
18:02后到家的概率为0.00135,所以
乘坐线路B,18:00前不一定能到家,
所以①错误:对于②,乘坐线路A在
17:58前到家的概率为P(X<48)=
21-P(40≤X≤48)]+P(40≤X<
×1-0.9545)+0.9545=
48)≈2
0.97725,乘坐线路B在17:58前到家
的概率为PY<41)=2[1
P(25Y41)]+P(25≤Y
×(1-0.9545)+0.9545=
41)≈2
0.97725,所以乘坐线路A和乘坐线路
B在17:58前到家的可能性一样,所以
②错误;对于③,乘坐线路A在17:54
前到家的概率为P(X<44)=弓,乘
坐线路B在17:54前到家的概率为
PY<3)=21-P(9≤Y<
87J+P(29≤Y<37)≈2×1
0.6827)+0.6827=0.84135>2
所以乘坐线路B比乘坐线路A在
17:54前到家的可能性更大,所以③正
确;对于④,乘坐线路A在17:48前到家
的概率为P(X<38)=1-P(8≤
X≤50)]≈2
1
×(1-0.9973)=
0.00135<0.01,所以④正确.故不合
理的为①②.
9.8
随机抽样、用样本
估计总体
…》回顾·必备知识《
知识梳理
1.(1)相等(2)抽签法随机数法
2.(1)简单随机抽样分层随机抽样
(3)各层平均数
3.(2)①极差②组距组数③数据
4.(2)②中间
平均数③最多
考教衔接
C根据频数分布表可知,6十12十
18=36<50,所以亩产量的中位数不
小于1050kg,故A错误;亩产量不低
于1100kg的频数为24十10=34,所
以亩产量低于1100kg的稻田占比为
参考答案503
100-34=66%,故B错误:稻田亩产
100
量的极差最大值小于1200一900=
300(kg),最小值大于1150-950=
200(kg),故C正确;由频数分布表可
得这100块稻田亩产量的平均值的最
小值为10×(6X900+12×950十
18×1000+30×1050+24×1100+
10×1150)=1042(kg),故D错误.故
选C
基础检测
1.(1)√(2)×(3)×(4)/
2.39
3.54
解析:前两组的频数为100×(0.05十
0.11)=16,因为后五组的频数和为
64,所以前三组的频数和为36,所以第
三组的频数为36一16=20,又最大频
率为0.34,故第四组的频数为0.34×
100=34,所以a=20十34=54.
4.20
解析:由于数据x1,x2,x3,x1,x5的
方差为5,所以数据2x1-3,2x2-3,
2x3一3,2x1一3,2x5一3的方差为
22×5=20.
5.BCD对于A,由题图知10×(x十
0.015+0.020+0.030+0.025)=1,
解得x=0.010,故A错误;对于B,成
绩在[50,80)内的频率为0.1十0.15十
0.2=0.45<0.6,成绩在[50,90)内
的频率为0.1十0.15十0.2十0.3=
0.75>0.6,因此第60百分位数m位
于区间[80,90)内,m=80
0.6-0.45×
0.3
(90一80)=85,所以估计样本数据的
第60百分位数约为85,故B正确;对于
C,平均数约为x=55×0.1十65×
0.15+75×0.2+85×0.3+95×
0.25=79.5(分),故C正确;对于D,成
绩低于80分的三组学生的人数之比为
0.1:0.15:0.2=2:3:4,则应抽取成
绩在[60,70)内的学生人数为30×
2+3+4=10,故D正确.故选BCD.
3
》提升·关键能力《…
例1(1)D对于A,平面直角坐标系中
有无数个点,这与要求总体中的个体
数有限不相符:对于B,老师表杨的是
发言积极的,对每一个个体而言,不具
备“等可能性”:对于C,错在总体容量是
无限的.故选D.
(2)09
解析:依题意,得到的样本编号依次为
14,05,11,09,…,则第4个样本编号
是09.
11
对点训练11010
解析:在抽样过程中,个体a每一次被
抽中的可能性是相等的,因为总体容
量为10,故个体a“第一次被抽到”的
可能性与“第二次被抽到”的可能性均
为0
504红对构·讲与练·高三数学·
例2(1)D根据比例分配的分层随机抽
样的定义知初中部共抽取60X400
600
200
40(人),高中部共抽取60×600
20(人),根据组合公式和分步乘法计
数原理得不同的抽样结果共有C8。·
C20种.故选D.
(2)B设中年人抽取x人,青少年抽
取y人,由比例分配的分层随机抽样可
知200
.x80
40=36'480三6,解得x=1正
y=6,故中年人比青少年多抽取9人
故选B.
对点训练2BCD从中随机抽取60家商
店,则样本容量为60,B正确;因为三种
类型的商店的数量之比为1:5:9,所
以大、中、小型商店分别抽取4家、
20家、36家,且20-4=16(家),A错
误,C正确;被抽取的60家商店每日的
零售额情况是所抽取的一个样本,
D正确.故选BCD.
例3(1)CD对于A,若第一组的平均数
为x,第二组的平均数为y,则y=x十
c,且c≠0,故平均数不相同,故A错
误;对于B,若第一组的中位数为x;,则
第二组的中位数为y:=x,十c,显然
不相同,故B错误;对于C,若第一组的
方差为s1,第二组的方差为s,则s=
s,故方差相同,即标准差相同,故C正
确;对于D,由极差的定义知,若第一组
的极差为xmx一xmm,则第二组的极差
为ymx一ymin=(xnas十c)一(xms十
C)=工mx一xmm,故极差相同,故D正
确.故选CD.
(2)BD设x2,x3,x1,x5的平均数为
m,x1,x2,…,x6的平均数为n,则n
m=1十xg十x3十x1十x;十x6
6
x,十x3十x1十x5=
2(x1十x6)一(x2十x3十x1十x5)
12
因为无法确定2(x1十xB)与x2十x3十
x1十x5的大小关系,所以无法判断,
n的大小,故A错误;不妨设x1≤
x2≤x3≤x1≤x5≤x6,可知x2,
xx1x5的中位数等于x1,x2,
工6的中位数,均为十,故B正确:
2
因为x1是最小值,x:是最大值,则
x2x,x1x5的波动性不大于x1,
x2,…,x6的波动性,即工2x,x1x5
的标准差不大于x1x2,…,x6的标准
差,故C错误;不妨设x1≤x2≤x3≤
x1≤x:≤x6,则x6一x1≥x5一x2,
当且仅当x1=x2x5=x6时,等号成
立,故D正确.故选BD.
对点训练3解:1)x=0X(9.8+
10.3+10.0+10.2+9.9+9.8+
10.0+10.1+10.2+9.7)=10,y
0×(10.1+10.4+10.1+10.0+
10.1+10.3+10.6+10.5+10.4+
10.5)=10.3,si=10
1
×(0.22+
基础版
0.32+0+0.22+0.12十0.22十0十
0.12+0.22+0.32)=0.036,s=
0×(0.2+0.1+0.2+0.32+
0.22+0+0.32+0.22+0.12+
0.2)=0.04.
(2)依题意,y-x=0.3=2×0.15=
2×√0.15=2√0.0225,
/0.036+0.04
=2√0.0076,所
10
以y-x>2
十5,所以新设备生
10
产产品的该项指标的均值较旧设备有
显著提高。
例4C24×25%=6,所以这24户居民
的月均用水量的第25百分位数为
5.5+6.7
=6.1(t).故选C
2
对点训练46
解析:由题知该组数据的极差为17
2=15,中位教为m十12,所以m十12
2
2
3
15×5
=9→m=6,又6×40%=
2.4,所以该组数据的第40百分位数是
该组数据的第三个数,为6.
例5D设[70,80)组的频率为a,则由
各组频率之和为1,可得10×(0.01
0.02+0.03+0.02)+a=0.8+a=
1,解得a=0.2,则[50,60),[60,70),
[70,80),[80,90),[90,100]各组频率
依次为0.1,0.2,0.2,0.3,0.2,[80,
90)组频率最大,即成绩在[80,90)上
的人数最多,故A正确:成绩低于70分
的学生频率为0.1十0.2=0.3,即不低
于70分的学生频率为1一0.3=0.7,
所以成绩不低于70分的学生所占比例
为70%,故B正确;根据频率分布直方
图,可得50名学生成绩的平均数是
55×0.1+65×0.2+75×0.2+85×
0.3十95×0.2=78(分),由0.1
0.2十0.2=0.5,故50名学生成绩的中
位数为80分,所以50名学生成绩的平
均数小于中位数,故C正确:极差为数
据中最大值与最小值的差,已知50名
学生的成绩都在区间[50,100]内,但
成绩的最大值不一定是100分,最小值
也不一定是50分,故极差小于或等于
50分,但不一定等于50分,故D错误.
故选D.
对点训练5解:(1)由每个小矩形的面积
之和为1,得0.05+0.1十0.2+10a十
0.25+0.1=1,解得a=0.030.
(2)成绩落在[40,80)内的频率为
0.05十0.1十0.2十0.3=0.65,落在
[40,90)内的频率为0.05+0.1十
0.2+0.3+0.25=0.9,
显然第75百分位数m∈[80,90),由
0.65十(1-80)×0.025=0.75,解得
m=84,
所以样本成绩的第75百分位数为84分.
(3)由频率分布直方图知,成绩在[50,
60)的人数为100×0.1=10,
成绩在[60,70)的人数为100×0.2=
20,所以:=10×56+20×65=
10+20
62(分):
由样本方差计算总体方差公式,得总
方差为s2=
{10×7+(56
10+20
62)2]+20×[4+(65-62)2]}=23.
聚焦学科素养
题目呈现1ABD2024年第一季度全市
居民人均消费支出为2084十453十
1435+356+791+583+528+163=
6393(元),故A正确;易知居住及食品
烟酒两项的人均消费支出总和为
2084+1435=3519(元),占总人均
消竟支出的3519
×100%≈55.0%>
6393
50%,故B正确:依题意可得2023年第
一季度城乡居民人均消费支出的差额
为79244388」
1.0441.078≈3520(元),2024年
第一季度城乡居民人均消费支出的差
额为7924-4388=3536(元),由于
3520<3536,故C错误;医疗保健与
教育文化娱乐两项人均消费支出总和
占总人均消费支出的528+791
×100%≈
6393
20.6%,故D正确.故选ABD
题目呈现2AB亲子阅读占比71.08%,
为最大,A正确:由于71.08%十
52.66%-1=23.74%>20%,B正
确;题图中各类亲子活动占比的中位数
为
27.77%+40.14%
=33.955%,
2
C错误:题图中10类亲子活动占比的
极差为71.08%-13.32%=57.76%,
D错误.故选AB.
题目呈现3D①由题图可得这13个月
的PMI的最大值为52.6%,最小值为
47.0%,所以极差为52.6%一47.0%
5.6%,故①正确;②由题图可得2023
年1月到2023年3月的PMI分别为
50.1%,52.6%,51.9%,均大于50%,
故②正确:③从2023年1月到2023年
7月的PMI的值从小到大排列为48.8%,
49.0%,49.2%,49.3%,50.1%,51.9%,
52.6%,因为7×75%=5.25,所以这
7个月的PMI的第75百分位数为第六
个数51.9%,故③正确:④2023年7月
的PMI为49.3%,6月的PMI为
49.0%,所以比上月上升0.3个百分点,
故④正确.所以正确的个数为4.故选D.
题目呈现4C由题图可知,2024年母
亲周末陪伴孩子日均时长超过8小时
的占比为38.7%>3,A说法正确,
2024年父亲周末陪伴孩子日均时长超
过6小时的占比为31.5%+24.2%=
55.7%>2,B说法正确:2024年母亲
周末陪伴孩子日均时长的5个时段占
比的极差为38.7%一2.5%=36.2%,
C说法错误;2024年父母周末陪伴孩子
日均时长的10个时段占比的中位数为
21.4%十19.0%
=20.2%,D说法正
2
确.故选C.
题目呈现5D2021一2024年该国星级
酒店数量依次为8920,8423,7676,
7337,逐年减少,故A正确:2021—2024
年该国星级酒店营业收入最高为
1907.77亿元,故B正确:2021一2024
年该国星级酒店餐饮收入比重最高的
是2022年,故C正确:2021一2024年该
国星级酒店餐饮收入比重的极差是
41.63%一38.19%=3.44%,故D错
误.故选D.
9.9
成对数据的统计分析
》回顾·必备知识《
知识梳理
1.(1)有关系(2)增加减小
(3)一条直线
2.(2)正相关负相关(3)强
弱
3.(2)预测值
4.(2)是否独立
基础检测
1.(1)/(2)×(3)X
2.y=c·dr(c,d>0)
解析:根据散点图判断,用y=c·
d严(c,d>0)的拟合效果更好.
3.97.5
解析:由已知可得X2=6.109
5.024,所以市政府断言市民收入增减
与旅游需求有关的可信度是97.5%.
4.12
解析:设被调查的男性人数为k,依题
意,得2×2列联表如下:
足球
性别
合计
喜爱
不喜爱
5k
男性
k
6
6
女性
2k
4k
2k
3
3
合计
3k
3k
3k
2
2
4k
6
则X”=
3
6
3k 3k
k·2k·2
·2
,因为本次调查得出“在犯错误的概
2k
率不超过0.005的前提下认为喜爱足
球与性别有关”的结论,于是X≥
7.879,即2
≥7.879,解得k≥11.8185,
而k=61,m∈N,因此km=12.
5.BC对于A,样本相关系数r的绝对
值越大,则成对样本数据的线性相关
程度越强,故A错误:对于B,经验回归
直线一定经过点(x,y),故B正确;对
于C,决定系数R的值越接近1,则经
验回归方程拟合效果越好,故C正确;
对于D,残差平方和越小,表示经验回
归方程拟合效果越好,故D错误.故
选BC.
》提升·关键能力《…
例1D第一个散,点图中的,点是从左下
角区域分布到右上角区域,则是正相
关:第三个散点图中的点是从左上角
区域分布到右下角区域,则是负相关;
第二个散点图中的点的分布没有什么
规律,则是不相关,所以应该是
①③②.故选D.
对点训练1A由题中散,点图可以看
出,题图1和题图3是正相关,样本相
关系数大于0,题图2和题图4是负相
关,样本相关系数小于0,题图1和题图
2的,点相对更加集中,所以线性相关性
更强,所以r1更接近1,r2更接近一1,由
此可得r2<r1<0<r3<r1.故选A
例2(1)C因为沿海地区气温和海水表
层温度相关,且样本相关系数为正数,
故随着沿海地区气温由低到高时,海
水表层温度呈上升趋势,故选C
(2)B残差图越宽,说明模型的拟合
效果越差,故A错误;残差平方和越
小,说明模型的拟合效果越好,故B正
确;决定系数R2越小,说明模型的拟合
效果越差,故C错误:样本相关系数”
的绝对值越大,两个变量的线性相关
性越强,故D错误.故选B.
对点训练2(1)DR越大,则回归模型
的拟合效果越好,因为0.56>0.45>
0.23>一0.79,所以拟合效果最好的是
模型丁.故选D.
(2)BD由r越接近1,数据的线性
相关关系越强知,A错误,B正确:由残
差平方和越小,则数据的线性回归模
型拟合效果越好知,C错误;由决定系
数越大,则数据的线性回归模型拟合
效果越好知,D正确.故选BD.
例3解:(1)由统计图的数据,可得x
2士3+4十6+8+10+8-5≈7,
y=18+22+31+42+50+56+58-
7
222≈39:
7
又由∑(x,-x)(y,-y)=395,
∑x,-=97,
所以6-
≈4,a=y-bx≈39-
4×7=11,
所以y关于x的经验回归方程为y=
4x+11.
(2)由统计图中的数据以及(1)中的经
验回归方程,可得统计表如下:
x
2
3
4
6
81013
y
13
22
37
42
50
56
58
19
23
27
35
51
63
残差一
6
-5
所以该组数据残差的平方和为(一6)+
(-1)2+42+72+72+52+(-5)2=
201.
对点训练3解:(1)由表中数据可知,
x-
5×(1+2+3+4+5)=3,y=
5×(3+7+9+10+11)=8
∑(x,-x)2=10,∑0y,-y)2=
=1
i=1
40,∑(x,-元)(y,-)=19,
i=1
则x=
∑(x,-x)(0y,-
=1
(y,-y)
N=1
19
=0.95>0.75,
√10×2√/10
故研发投入与产品收益的相关程度
较强.
参考答案505246对构·讲与练·高三数学·基础版
正态分布N(100,2).从本市中任选1名高二
间X(单位:分钟)服从正态分布N(44,2),下
学生,则这名学生数学成绩在区间[102,104]
车后步行到家要5分钟;乘坐线路B所需时间
内的概率约为
Y(单位:分钟)服从正态分布N(33,4),下车
参考数据:若随机变量X~N(μ,o2),则
后步行到家要12分钟.从统计角度分析,下列
P(H-o≤X≤k+o)≈0.6827,P(u
说法不合理的是
(填序号)
第
2o≤X≤h+2o)≈0.9545,P(u-3o≤
参考数据:若Z~N(,o),则P(一o<
X≤4十3o)≈0.9973.
Z<4+o)≈0.6827,P(4-2o<Z<4十
章
学生试答:
2o)≈0.9545,P(u-3o<Z<h+3o)≈
0.9973.
①若乘坐线路B,18:00前一定能到家;
②乘坐线路A比乘坐线路B在17:58前到家
的可能性更大;
③乘坐线路B比乘坐线路A在17:54前到家
规律总结
的可能性更大;
由以,0分布区间的特征进行转化,使分布区间
④若乘坐线路A,则在17:48前到家的可能性
转化为3σ特殊区间,从而求出所求概率.注意标准
不超过1%
正态分布下对称轴为直线x=0.
》温馨提示
【对点训练5】老张每天17:00下班回家,通常步
行5分钟后乘坐公交车再步行到家,公交车有
学习至此,请完成训练65
A,B两条线路可以选择,乘坐线路A所需时
9.8
随机抽样、用样本估计总体
考试
1.会用简单随机抽样的方法从总体中抽取样本,了解分层随机抽样.2.理解统计图表的含义.3.会用统
要求
计图表对总体进行估计,会求n个数据的第力百分位数.4.能用数字特征估计总体集中趋势和总体离
散程度
回顾
》必备知识
》知识梳理《
一起作为总样本,这样的抽样方法称为
,每一个子总体称为层
1.简单随机抽样
(2)适用范围:总体可以分层,且层与层之间有
(1)特点:逐个抽取,且每个个体被抽取的概
明显区别,而层内个体差异较小
率
(3)平均数的计算:各层抽样比乘
(2)常用方法:
和
的和.
(3)适用范围:个体性质相似,无明显层次,且个
3.统计图表
体数量较少,尤其是样本容量较小
(1)常见的统计图有条形图、扇形图、折线图、频
2.分层随机抽样
率分布直方图等,
(1)定义:一般地,按一个或多个变量把总体划
(2)作频率分布直方图的步骤
分成若干个子总体,每个个体属于且仅属于
①求
个子总体,在每个子总体中独立地进行
②决定
与
,再把所有子总体中抽取的样本合在
③将
分组:
第九章
概率与统计
247
④列频率分布表;
(2)若数据2x1,x2,…,xm的方差为s2,则
⑤画频率分布直方图.
①数据x1十a,x2十a,…,xn十a的方差为s2;
4.用样本估计总体
②数据a.x1,ax2,…,a.xn的方差为a2s2
(1)百分位数
考教衔接
一般地,一组数据的第力百分位数是这样一个
【高考这样考】
值,它使得这组数据中至少有p%的数据小于
(2024·新课标Ⅱ卷)某农业研究部门在面积相等
第
或等于这个值,且至少有(100一p)%的数据大
的100块稻田上种植一种新型水稻,得到各块稻
九
于或等于这个值:
田的亩产量(单位:kg)并整理得下表:
章
(2)平均数、中位数和众数
[900,
[950,
1000,1050,1100,L1150
①平均数7=((x1十十十t).
亩产量
950)1000)1050)1100)1150)1200)
n
频数
6
12
18
30
24
10
②中位数:将一组数据按从小到大或从大到小
的顺序排列,处在最
的一个数据(当数
根据表中数据,下列结论中正确的是
据个数是奇数时)或最中间两个数据的
A.100块稻田亩产量的中位数小于1050kg
B.100块稻田中亩产量低于1100kg的稻田所占
(当数据个数是偶数时).
比例超过80%
③众数:一组数据中出现次数
的数据
C.100块稻田亩产量的极差介于200kg至300kg
(即频数最大值所对应的样本数据).
之间
(3)方差或标准差
D.100块稻田亩产量的平均值介于900kg至
0方差:s=之(x-x)或
1
1000kg之间
n-1
x号-元2
n=
【教材这样教】
(人教A版必修第二册P225复习参考题9第8题)
②标准差:5=
1
(x-x)2
一名学生通过计步仪器,记录了自己100天每天
(4)总体(样本)方差
走的步数,数据如下:
5678130398666…98588922
①一般式:如果总体中所有个体的变量值分别
12682(部分数据省略)
为Y,Y2,…,YN,总体平均数为Y,则总体方差
(1)画出这组数据的频率分布直方图,并分析数据
为s-
N2,-
的分布特点;
(2)计算这组数据的平均数、中位数和标准差,并
②加权式:如果总体的N个变量值中,不同的
根据这些数值描述这名学生的运动情况,
值共有(k≤N)个,不妨记为Y,Y2,…,Yk,
衔接解读:试题以某生产问题的频数分布表为
其中Y,出现的频数为f,(i=1,2,…,k),则总体
载体,主要考查对频数分布表的理解和统计数据的
1
分析,计算相关的样本数字特征并理解其包含的统
方差为S2=
21-
计意义,考查学生的数据分析、逻辑推理、数学运算
等核心素养.高考试题是以频数分布表为背景,教材
○常用结论与知识拓展
的习题则是先绘制频率分布直方图,再研究其样本
1.频率分布直方图与众数、中位数、平均数的关系
的数字特征,而绘制频率分布直方图必须先得到频
(1)最高的小长方形底边中点的横坐标即是众数.
数分布表.因此在教学过程中,要注重“基本功”的锤
(2)中位数左边和右边的小长方形的面积和是相等的.
炼与夯实,切勿浅尝辄止.
(3)平均数是频率分布直方图的“重心”,等于频率
分布直方图中每个小长方形的面积乘小长方形底边中
》基础检测《
点的横坐标之和.
1.判断下列命题是否正确,正确的在括号内画
2.平均数、方差公式的推广
“/”,错误的画“X”
(1)若数据x1x2,…,xm的平均数为x,则mx1十a,
(1)简单随机抽样每个个体被抽到的机会一样,
mx2十a,m.xa十a,,mxm十a的平均数是mx十a.
与先后无关。
()
248亿对构·讲与练·高三数学·基础版
(2)在比例分配的分层随机抽样中,每个个体被4.(教材改编题)已知数据x1,x2,x3,x4,x5的方
抽到的可能性与层数及分层有关,
(
差为5,则数据2x1-3,2x2-3,2x3一3,2x4
(3)若样本量n=100,则第75百分位数是从小
3,2x5一3的方差为
到大排列的第75个数.
()
5.(多选题)(教材改编题)某校组织“校园安全”知
(4)频率分布直方图中,小长方形的面积越大,表
识测试,随机调查600名学生,将他们的测试成
示样本数据落在该区间的频率越大.()
第
绩(满分100分,单位:分)按照[50,60),[60,
2.(教材改编题)在一次篮球比赛中,某支球队共
70),…,[90,100]分成五组,得到如图所示的频
章
进行了8场比赛,得分(单位:分)分别为29,30,
率分布直方图,则下列说法正确的是
38,25,37,40,42,32,那么这组数据的第75百分
↑频率
位数为
组距
0.030
3.(教材改编题)为了了解某校高三学生的视力情
0.025
况,随机抽查了该校100名高三学生的视力情
0.020
况,得到频率分布直方图如图所示,由于不慎将
0.015
部分数据丢失,但知道后五组的频数和为64,最
大频率为0.34,设视力在4.6到4.8之间的学生
人数为a,则a的值为
0V5060
708090100成绩/分
频率
A.图中x=0.100
组距
B.估计样本数据的第60百分位数约为85
C.若每组数据以所在区间的中点值为代表,则
这600名学生成绩的平均数约为79.5分
D.若用按比例分配的分层随机抽样的方法抽取
1.1
30名成绩低于80分的学生,则成绩在[60,
0.5
70)内的学生应抽取10人
04.44.54.64.74.84.95.05.15.2视力
提升
关键能力
考点1简单随机抽样与分层随机抽样
666740371464057111056509958668
7683203790
命题角度1简单随机抽样
571603116314908445217573880590
【例1】(1)下列抽样方法是简单随机抽样的是
5223594310
若从表中第1行第9列开始向右依次读取数
A.从平面直角坐标系中抽取5个点作为样本
据,则得到的第4个样本编号是
B.“隔空不隔爱,停课不停学”,网课上,李老师
幻学生试答:
对全班45名学生中发言积极的3名学生进
行了表扬
C.老师要求学生从实数集中逐个抽取10个数
分析奇偶性
D.某运动员从8条跑道中随机抽取一条跑道
规律总结
试跑
1.简单随机抽样需满足:①被抽取的样本总体
(2)某工厂利用随机数表对生产的50个零件
中的个体数有限;②逐个抽取;③等可能抽取.
进行抽样测试,先将50个零件进行编号,编号
2.简单随机抽样常用抽签法(适用于总体中个
分别为01,02,…,50,从中抽取5个样本,下面
体数较少的情况)、随机数法(适用于个体数较多的
提供随机数表的第1行到第2行:
情况).
第九章概率与统计
249
【对点训练1】用简单随机抽样的方法从含有10
A.抽取的中型商店比大型商店多4家
个个体的总体中抽取一个样本量为3的样本,
B.样本容量为60
其中某一个体a“第一次被抽到”的可能性与
C.大、中、小型商店分别抽取4家、20家、36家
“第二次被抽到”的可能性分别是
D.被抽取的60家商店每日的零售额情况是所
抽取的一个样本
命题角度2分层随机抽样
考点2样本的数字特征
第
【例2】(1)(2023·新课标Ⅱ卷)某学校为了解学
命题角度1平均数、中位数、众数、方差、标准差、
九
生参加体育运动的情况,用比例分配的分层随
章
极差
机抽样方法作抽样调查,拟从初中部和高中部
【例3】(1)(多选题)(2021·新高考I卷)有一组
两层共抽取60名学生,已知该校初中部和高中
样本数据x1,x2,…,xn,由这组数据得到新样
部分别有400名和200名学生,则不同的抽样
结果共有
本数据y1y2,…,ym,其中y;=x,十c(i=1,
2,…,n),c为非零常数,则
()
A.C48·C5种
B.C·C0种
A.两组样本数据的样本平均数相同
C.C9,·C0。种
D.C480·C2种
B.两组样本数据的样本中位数相同
(2)电影《孤注一掷》的上映引发了对电信诈骗
问题的热议,也加大了各个社区反电信诈骗的
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
宣传力度.已知某社区共有居民480人,其中老
(2)(多选题)(2023·新课标I卷)有一组样本
年人200人,中年人200人,青少年80人,若按
年龄进行比例分配的分层随机抽样,共抽取36
数据x1x2,…,x6,其中x1是最小值,x6是最
大值,则
()
人作为代表,则中年人比青少年多抽取(
A.6人
B.9人
A.x2x3x4x5的平均数等于x1x2,…,x6
C.12人
的平均数
D.18人
学生试答:
B.x2x3,x4,x5的中位数等于x1,x2,…,x6
的中位数
C.x2,x3,x4,x5的标准差不小于x1x2,…,
x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6
的极差
幻学生试答:
规律总结
1.在比例分配的分层随机抽样中,抽样比
样本容量各层样本容量
总体容量一各层个体总量
2.在比例分配的分层随机抽样中,如果第一层
的样本量为m,平均值为x;第二层的样本量为n,平
均值为y,则样本的平均值为mx十
规律总结
m+n
用样本估计总体时,样本的平均数、标准差只
【对点训练2】(多选题)某市有大、中、小型商店
是总体的平均数、标准差的近似值.实际应用时,需
共1500家,且这三种类型的商店的数量之比
先计算样本数据的平均数,分析平均水平,再计算方
为1:5:9,现在要调查该市商店的每日零售额
差(标准差)分析稳定情况。
情况,用比例分配的分层随机抽样的方法从中
【对点训练3】(2021·全国乙卷)某厂研制了一
随机抽取60家商店,则下列选项正确的有
种生产高精产品的设备,为检验新设备生产产
品的某项指标有无提高,用一台旧设备和一台
250构·讲与练·高三数学·基础版
新设备各生产了10件产品,得到各件产品该项学生试答:
指标数据如下:
旧设备9.810.310.010.29.99.810.010.110.29.7
新设备10.110.410.110.010.110.310.610.510.410.
旧设备和新设备生产产品的该项指标的样本
第
平均数分别记为x和y,样本方差分别记为s
和s
章
(1)求x,y,s,s2;
(2)判断新设备生产产品的该项指标的均值较
规律总结
计算一组n个数据的第力百分位数的步骤
旧设备是否有显著提高.(如果y一x≥
从小到大排列原始数据
十,则认为新设备生产产品的该项指
2
第二步
计算i=nXp%
标的均值较旧设备有显著提高,否则不认为有
若不是整数,而大于的比邻整
数为j,则第p百分位数为第项数
显著提高》
据
第三步
若i是整数,则第p百分位数为第
项与第i+1项数据的平均数
【对点训练4】
组数据按从小到大的顺序排列
为2,4,m,12,16,17,若该组数据的中位数是
·则该组数据的第40百分
考点3频率分布直方图
【例5】某校组织50名学生参加庆祝中华人民共
和国成立75周年知识竞赛,经统计,这50名学
生的成绩(单位:分)都在区间[50,100]内,按
分数分成5组:[50,60),[60,70),[70,80),
[80,90),[90,100],得到如图所示的频率分布
直方图(不完整),根据图中数据,下列结论错
误的是
()
命题角度2百分位数
频率
↑组距
【例4】通过抽样调查得到某栋居民楼24户居民
0.03
的月均用水量数据(单位:t),将其按从小到
0.02
大排序如下:2.1,3.2,3.2,4.3,4.3,5.5,6.7,
0.01
8.9,9.4,9.5,9.5,9.9,10.1,10.5,11.1,11.2,
12.5,14.8,15.2,15.3,18.4,19.0,20.8,22.4,
05060708090100成绩/分
则估计这24户居民的月均用水量的第25百分
A.成绩在[80,90)上的人数最多
位数为
B.成绩不低于70分的学生所占比例为70%
A.4.3t
B.5.5t
C.50名学生成绩的平均数小于中位数
C.6.1t
D.6.7t
D.50名学生成绩的极差为50分
第九章概率与统计
251
学生试答:
(3)已知落在[50,60)的平均成绩是56分,方
差是7,落在[60,70)的平均成绩为65分,方差
是4,求两组成绩的总平均数之和总方差2.
频率
组距
a
0.02
0.020
第
0.010
九
0.005
章
规律总结
0405060708090100成绩/分
1.在频率分布直方图中,每个小矩形的面积就
是相应的频率,所有小矩形的面积之和为1,这是解
题的关键,也是识图的基础
2.准确理解频率分布直方图的特点,频率分布
直方图中纵轴上的数据是各组的频率除以组距,不
要误以为纵轴上的数据是各组的频率,不要和条形
图混淆
3.频率分布直方图中的计算:其中众数取最高
的小矩形底边中点的横坐标;求中位数,可将频率分
布直方图划分为左、右两个面积相等的部分,分界线
与横轴交点的横坐标即是中位数(如先确定中位数
所在区间,利用“0.5一较低累积频率=(x一区间左
端点)X区间纵坐标”,求得的x便是).
【对点训练5】某市每年定期组织同学们进行禁
毒知识竞赛活动,为了解同学们对禁毒知识的
掌握情况,现从所有答卷中随机抽取100份作
为样本,将样本的成绩(满分100分,成绩均为
不低于40分的整数)分成六段:[40,50),[50,
60),…,[90,100],得到如图所示的频率分布
直方图
(1)求频率分布直方图中a的值;
(2)求样本成绩的第75百分位数;
聚焦学科素养。数学应用背景下的“图表数据分析”问题
【题目呈现1】(多选题)(2024·辽宁大连二
医疗保健528元
,其他用品及服务163元
模)如图为某市2024年第一季度全市居民人均消
交通通信583元
费支出构成图,已知城镇居民人均消费支出7924
居住2084元
教育文化娱乐791元
元,与上一年同比增长4.4%;农村居民人均消费
生活用品及服务356元
衣着453元
支出4388元,与上一年同比增长7.8%,则关于
食品烟酒1435元
2024年第一季度该市居民人均消费支出,下列说
A.2024年第一季度该市居民人均消费支出
法正确的是
(
6393元
252红对构·讲与练·高三数学·基础版
B.居住及食品烟酒两项的人均消费支出总和
(%)50%=与上月比较无变化
54
超过了总人均消费支出的50%
53
52.6
C,城乡居民人均消费支出的差额与上一年同
52
51.9
50.1
50.1
比在缩小
50
的09.4
49
49.0
D.医疗保健与教育文化娱乐两项人均消费支
48
49.2
49.248.8
49.3
4
48.0
¥47.0
出总和约占总人均消费支出的20.6%
46
九
学生试答:
022年891011122023年234567
7月月月月月月1月月月月月月月
有下列说法:
①从2022年7月到2023年7月这13个月的
PMI的极差为5.6%;
②PMI大于50%表示经济处于扩张活跃的
状态,PMI小于50%表示经济处于低迷萎缩的状
【题目呈现2】(多选题)(2024·湖南邵阳模
态,则2023年1月到2023年3月,经济处于扩张活
拟)有关数据显示,年轻一代的父母更加重视亲子
跃的状态;
陪伴,以往“以孩子为中心”的观念正逐步向与孩
③从2023年1月到2023年7月这7个月的
子玩在一起、学在一起的方向转变.如图为2024年
PMI的第75百分位数为51.9%;
中国父母参与过的各类亲子活动人数在参与调查
④2023年7月的PM为49.3%,比上月上升
总人数中的占比,根据该图,下列说法正确的是
0.3个百分点
(
其中正确的有
()
角色扮演
A.1个
B.2个
C.3个
D.4个
亲子阅读
亲子合唱
学生试答:
子运动会
亲子种植
2
子游戏
亲子舞蹈
亲子烘培
亲子研学旅行
亲子演出
【题目呈现4】孩子在成长期间最需要父母
口占比
的关爱与陪伴,如图为2024年中国父母周末陪伴
A.在参与调查的总人数中父母参与过的亲子
孩子日均时长统计图,根据该图,下列说法错误
活动最多的是亲子阅读
的是
()
B.在参与调查的总人数中同时参与过亲子阅
%
2024年中国父母周末陪伴孩子日均时长
读与亲子运动会的父母不少于20%
100
31.5
C.图中各类亲子活动占比的中位数为
80
38.7
40.14%
60
24.2
40
30.9
D.图中10类亲子活动占比的极差为57.70%
21.4
20
19.0
16.9
学生试答:
0
■、01
8925
父亲
母亲
口1一2小时口2一4小时□4一6小时
☐6一8小时
■8小时以上
A.2024年母亲周末陪伴孩子日均时长超过8
小时修占花大日
B.2024年父亲周末陪伴孩子日均时长超过6
【题目呈现3】2023年7月31日国家统计局
发布了制造业采购经理指数(PMI),如图所示.
小时的占比大于号
第九章概率与统计
253
C.2024年母亲周末陪伴孩子日均时长的5个
A.2021一2024年该国星级酒店数量逐年
时段占比的极差为28.8%
减少
D.2024年父母周末陪伴孩子日均时长的10
B.2021一2024年该国星级酒店营业收人最高
个时段占比的中位数为20.2%
不超过2000亿元
学生试答:
C.2021一2024年该国星级酒店餐饮收入比重
最高的是2022年
第
D.2021一2024年该国星级酒店餐饮收入比
重的极差是1.54%
章
学生试答:
【题目呈现5】如图为2021一-2024年某国星
级酒店数量、营业收入及餐饮收入比重,根据该
图,下列结论错误的是
(
)
10000
.41.63%
+42009%
.41.13%
8423
41.00%
39.3%
40.009%
67
39.00%
38.19%
337
38.0%
1907.71
1221.53
379.4
1177.68
37.00%
》温馨提示
36.00%
2021
2022
2023
2024
学习至此,请完成训练66
☐星级酒店营业收入亿元
门星级酒店数量/家
一餐饮收入比重/%
9.9
成对数据的统计分析
考试
1.了解样本相关系数的统计含义.2.理解一元线性回归模型和2×2列联表,会运用这些方法解决简单
要求
的实际问题。
回顾>必备知识
》知识梳理《
(2)当r>0时,称成对样本数据
;当
1.变量的相关关系
r<0时,称成对样本数据
(1)相关关系:两个变量
,但又没有确
(3)r≤1;当|r|越接近1时,成对样本数据
切到可由其中的一个去精确地决定另一个的程
的线性相关程度越
;当|r|越接近0
度,这种关系称为相关关系.
时,成对样本数据的线性相关程度越
(2)正相关、负相关:从整体上看,当一个变量的值
3.一元线性回归模型
增加时,另一个变量的相应值也呈现
(1)我们将y=bx十a称为Y关于x的经验回
的趋势,就称这两个变量正相关;当一个变量的
值增加时,另一个变量的相应值呈现
的趋势,则称这两个变量负相关.
归方程,其中
(3)线性相关:一般地,如果两个变量的取值呈
x,-)
=1
现正相关或负相关,而且散点落在
附
a =y-bx.
近,我们称这两个变量线性相关。
(2)残差:观测值减去
所得的差称为
2.样本相关系数
残差
∑(x-x)(y,-y)
4.列联表与独立性检验
(1)r=
(1)关于分类变量X和Y的抽样数据的2×2列
空-2-0
联表: