内容正文:
艺考一本通数学
第17讲
抽样方法与总体分布的估计
自主预习
知识梳理
夯实基础
1.抽样方法
适用范围:总体的个体数不多
从调查的对象中按照一定的方法抽取一部
优点:抽签法简便易行,当总体的个体数不太
分,进行调查或观测,获取数据,并以此对调
多时适宜采用抽签法。
查对象的某项指标做出推断,这就是抽样调
②随机数表法:随机数表抽样“三步曲”:第一
查.调查对象的全体称为总体,被抽取的一部
步,将总体中的个体编号;第二步,选定开始
分称为样本.
的数字;第三步,获取样本号码:
(1)简单的随机抽样
(2)分层随机抽样
简单随机抽样的概念
当已知总体由差异明显的几部分组成时,为
设一个总体的个体数为N.如果通过逐个抽
了使样本更充分地反映总体的情况,常将总
取的方法从中抽取一个样本,且每次抽取时
体分成几部分,然后按照各部分所占的比例
各个个体被抽到的概率相等,就称这样的抽
进行抽样,这种抽样叫做分层抽样,所分成的
样为简单随机抽样.
部分叫做层
①用简单随机抽样从含有N个个体的总体
2.用样本估计总体
中抽取一个容量为n的样本时,每次抽取
(1)频率分布直方图
个个体时,任一个体被抽到的概率为:在整
结构一以横轴表示样本分组,纵轴表示频率与组距的此值
分
个抽样过程中各个个体被抽到的概率为;
+数揭一落在各小组内的濒率用各小长方形的面积表示
直
特性各小长方形面积的和等于1
②简单随机抽样的特点是:不放回抽样,逐个
地进行抽取,各个个体被抽到的概率相等;
可以利用频率分布直方图估计总体的取值
③简单随机抽样方法体现了抽样的客观性与
规律。
公平性,是其他更复杂抽样方法的基础。
(2)百分位数与总体百分位数的估计
简单抽样常用方法
①第p百分位数:一般地,一组数据的第p百
①抽签法:先将总体中的所有个体(共有V
分位数是这样一个值,它使得这组数数据中
个)编号(号码可从1到N),并把号码写在形
至少有%的数据小于或等于这个值,且至
状、大小相同的号签上(号签可用小球、卡片、
少有(100一p)%的数据大于或等于这个值.
纸条等制作),然后将这些号签放在同一个箱
②可以用样本数据的百分位数估计总体的百
子里,进行均匀搅拌,抽签时每次从中抽一个
分位数
号签,连续抽取n次,就得到一个容量为n的
(3)众数、中位数和平均数与总体集中趋势的
样本.
估计
·100·
第一部分一轮单元复习第六单元
若x1…x为n个样本,则平均
验公式可直接利用换元,使新元与y具有线
平均数
数=比…+x
反映
性相关关系,进一步求出,对新元的线性回
数据
组从小到大排列的数,若个数
集中
是奇数位于中间的数为中位数:
归方程,换回x即可得y对x的回归曲线
趋势
中位数
若个数是偶数,中位数则是位于
的量
中间两数的平均数
方程
众数
一组数中出现次数最多的数据
(2)非线性回归问题有时并不给出经验公式,
(4)总体集中趋势的估计
这时按以下步骤求回归方程:
极差
一组数据中的最大值与最小值的差
①画出已知数据的散点图,看是否是线性回
反映
数据
方差
2=化-可+化-习++x-2
归分析问题,如果不是,把它与必修数学中学
离散
程度
过的函数(幂函数、指数函数、对数函数等)图
的量
标准差
(x1-)+(x2-)+…+(x-)
n
像作比较,挑选一种跟这些散点拟合得最好
3.两变量间的相关关系与统计案例
的函数,采用适当的变量置换,把非线性回归
(1)从散点图上看,如果这些点从整体上看大
分析问题化为线性回归分析问题
致分布在通过散点图中心的一条直线附近,
②作相关性检验,即判断寻找线性回归方程
称两个变量之间具有线性相关关系,这条直
是否有意义,
线叫回归直线。
③当寻找线性回归方程有意义时,计算系数
(2)从散点图上看,点分布在从左下角到右上
a,,得到线性回归方程.
角的区域内,两个变量的这种相关关系称为
④代回x得y对x的回归曲线方程.
正相关,点分布在左上角到右下角的区域内,
5.独立性检验
两个变量的相关关系为负相关,
(1)独立性检验
(3)回归方程为y=x十a,其中b
通过2×2列联表,
含-
Y
合计
X
b
a+b
,a=y-bx
a
含a好-n
d
c+d
(4)相关系数
合计
a+c
b+d
n=a+b+c+d
2(x-x)(y一
再通过卡方统计量公式计算K2的值,利用
随机变量K来确定在多大程度上可以认为
“两个分类变量有关系”的方法称为两个分类
当>0时,表明两个变量正相关;
变量的独立性检验。
当<0时,表明两个变量负相关,
(2)变量独立性的判断
r的绝对值越接近于1,表明两个变量的线性
通过对K?统计量分布的研究,已经得到两
相关性越强.r的绝对值越接近于0,表明两
个临界值:3.841和6.635。当数据量较大
个变量之间几乎不存在线性相关关系,通常
时,在统计中,用以下结果对变量的独立性进
r大于0.75时,认为两个变量有很强的线
行判断:
性相关性。
①如果K≤3.841时,认为事件A与B是无
4.非线性回归分析
关的。
(1)对于非线性回归分析问题,如果给出了经
②如果K2>3.841时,有95%的把握说事件
·101·
艺考一本通数学
A与事件B有关;
n(ad-bc)2
③如果K>6.635时,有99%的把握说事件
(ate)(b+d(a+b)(c+d)'
计算出K
A与事件B有关;
的值;
(3)独立性检验的基本步骤及简单应用
⑤统计推断:当K2>3.841时,有95%的把
要推断“A与B是否有关”,可按下面步骤
握说事件A与B有关;
当K2>6.635时,有99%的把握说事件A与
进行:
①提出统计假设H:事件A与B无关(相互
B有关;
独立);
当K>10.828时,有99.9%的把握说事件
②抽取样本(样本容量不要太小,每个数据都
A与B有关:
要大于5);
当K≤3.841时,认为事件A与B是无
③列出2×2列联表;
关的.
④根据2×2列联表,利用公式:K
典例剖析
典例变式
变式训练
题型一
简单随机抽样
【答案】①②③④
【例1】下列抽取样本的方式不属于简单随机
【规律方法】抽签法与随机数法的适用情况
抽样的有
(1)抽签法适用于总体中个体数较少的情况,随
①从无限多个个体中抽取100个个体作为
机数法适用于总体中个体数较多的情况!
样本
(2)一个抽样试验能否用抽签法,关键看两,点:
②盒子里共有80个零件,从中选出5个零
一是制签是否方便;二是号签是否易搅匀.一般
件进行质量检验.在抽样操作时,从中任意
地,当总体容量和样本容量都较小时可用抽
拿出一个零件进行质量检验后再把它放回
签法
盒子里,
变式训练一
③从20件玩具中一次性抽取3件进行质量
1.某校高三(1)班共有48人,学号依次为1,2,
检验
3,…,48,现用系统抽样的办法抽取一个容量
④某班有56名同学,指定个子最高的5名
为6的样本.已知学号为3,11,19,35,43的
同学参加学校组织的篮球赛,
同学在样本中,那么还有一个同学的学号应
【解析】①不是简单随机抽样.由于被抽取
为
()
的样本总体的个数是无限的,而不是有限
A.27
B.26
C.25
D.24
的。②不是简单随机抽样.由于它是放回抽
2.我国古代数学名著《数书九章》有“米谷粒分”
样.③不是简单随机抽样.因为这是“一次
题:粮仓开仓收粮,有人送来米1534石,验得米
性”抽取,而不是“逐个”抽取.④不是简单随
内夹谷,抽样取米一把,数得254粒内夹谷28
机抽样.因为指定个子最高的5名同学是
粒,则这批米内夹谷约为
()
56名中特指的,不存在随机性,不是等可能
A.134石
B.169石
抽样
C.338石
D.1365石
·102·
第一部分一轮单元复习
第六单元
3.某年级有1000名学生,随机编号为0001,
解得x=16,y=12,m=42.
0002,…,1000,现用系统抽样方法,从中抽出
【答案】(1)18(2)42
200人,若0122号被抽到了,则下列编号也
【规律方法】分层抽样问题的解题策略
被抽到的是
)
(1)确定抽样比.可依据各层总数与样本数之
A.0116
B.0927
C.0834
D.0726
比,确定抽样比,
4.2015年11月11日的“双十一”又掀购物狂潮,
(2)求某一层的样本数或总体个数.可依据题意
某网站对购物情况做了一项调查,收回的有效
求出抽样比,再由某层总体个数(或样本数)确
问卷共500000份,其中购买下列四种商品的
定该层的样本数(或总体数).
人数统计如下:服饰鞋帽198000人;家居用品
(3)求各层的样本数.可依据题意,求出各层的
94000人;化妆品116000人;家用电器92000
抽样比,再求出各层样本数
人.为了解消费者对商品的满意度,此网站用
变式训练二
分层抽样的方法从中选出部分问卷进行调查,
1.某班50名学生中有女生20名,按男女比例
已知在购买“化妆品”这一类中抽取了116人,
用分层抽样的方法,从全班学生中抽取部分
则在购买“家居用品”这一类中应抽取的问卷
学生进行调查,已知抽到的女生有4名,则本
份数为
(
次调查抽取的人数是
()
A.92
B.94
C.116
D.118
A.8
B.10
C.12
D.15
题型二分层抽样
2.某校共有高一、高二、高三学生1290人,其中
【例2】(1)某工厂生产甲、乙、丙、丁四种不同
高一480人,高二比高三多30人,为了解该校
型号的产品,产量分别为200,400,300,100
学生的身体健康情况,现采用分层抽样方法进
件.为检验产品的质量,现用分层抽样的方
行调查,在抽取的样本中有高一学生96人,则
法从以上所有的产品中抽取60件进行检
该样本中的高三学生人数为
()
验,则应从丙种型号的产品中抽取
A.84
B.78
C.81
D.96
件.
3.我国古代数学名著《九章算术》中有一抽样问
(2)一支田径队有男运动员56人,女运动员
m人,用分层抽样抽出一个容量为n的样
题:“今有北乡若干人,西乡七千四百八十八
本,在这个样本中随机取一个当队长的概率
人,南乡六千九百一十二人,凡三乡,发役三
百人,而北乡需遣一百零八人,问北乡人数几
为8且样本中的男队员比女队员多4人
何?”其意思为:“今某地北面有若干人,西面
则m
有7488人,南面有6912人,这三面要征调
【解析】(1)应从丙种型号的产品中抽取
300人,而北面共征调108人(用分层抽样的
300
60
200+400+300+100=18(件).
方法),则北面共有多少人?”
()
A.8000
B.8100
C.8200
D.8300
(2)由题意知n=28,设其中有男队员x人,
题型三样本估计总体
女队员有y人。
(一)频率分布直方图(高频考点)
x+y=28,
则x一y=4,
频率分布直方图是高考的热点,选择题、填
56-
空题、解答题都有可能出现.难度一般较小,
m y
高考对频率分布直方图的考查主要有以下
·103·
艺考一本通数学
三个命题角度:①求样本的频率、频数;②求样
【答案】(1)10.15
210.015
(23
0
本的平均数、众数、中位数;③与概率结合考查
(3)204.56
某区间内的个体被选中的概率」
【规律方法】
【例3】(2025·上海卷)2024年东京奥运会,
中国获得了男子4×100米混合泳接力金
(1)频率、频数、样本容量的计算方法:①海率
组距
牌.以下是历届奥运会男子4×100米混合
泳接力项目冠军成绩记录(单位:秒),数据
组距=频车巴得装蔡亚=频率,四擎=样
按照升序排列:
本容量,④样本容量×频率=频数
(2)频率分布直方图与众数、中位数、平均数的
206.78207.46207.95209.34209.35
210.68213.73214.84216.93216.93
关系:
(1)求这组数据的极差与中位数;
①最高的小长方形底边中点的横坐标为众数;
(2)从这10个数据中任选3个,求恰有2个
②中位数左边和右边的小长方形的面积和是相
数据在211以上的概率;
等的;
(3)若比赛成绩y关于年份x的回归方程为
③平均数是频率分布直方图的“重心”,等于频
y=-0.311x+b,年份x的平均数为2006,
率分布直方图中每个小长方形的面积乘以小长
预测2028年冠军队的成绩(精确到0.01
方形底边中点的横坐标之和」
秒).
【易错警示】①频率分布直方图的纵坐标是
【解析】(1)由题意,数据的最大值为
组距,而不是频率,切莫与条形图混淆.②制作
频
216.93,最小值为206.78,则极差为
好频率分布表后,可以利用各组的频率之和是
216.93一206.78=10.15;数据中间两数为209.
否为1来检验该表是否正确,
35与210.78,则中位数为209.35+210.68_
变式训练三
1.某平台招聘外卖骑手,该平台提供了两种日
210.015.故极差为10.15,中位数为210.015:
工资方案:方案①,规定每日底薪为50元,骑
(2)由题意,数据共10个,211以上数据共
手每完成一单业务提成3元;方案②,规定每
有4个,故设事件A=“恰有2个数据在211
日底薪为100元,前44单业务没有提成,从
以上”,则P(A)三适=0,故恰有2个
第45单业务开始,骑手每完成一单业务提成
5元.该平台记录了每天骑手的人均业务量,
数搭在211以上的概率为品:
现随机抽取100天的数据,将样本数据分为
(3)由题意,成绩的平均数
[25,35),[35,45),[45,55),[55,65),[65,
20678+20.4+207.95+209.31+209.35+21068+21373+214.84+216.93+2169盟
75),[75,85),[85,95]七组,整理得到如图所
=211.399,由直线y=-0.311x+b过
示的频率分布直方图.
(2006,211.399),则b=211.399+0.311×
十频率
组距
2006=835.265,故回归直线方程为y
0.030
-0.311x+835.265.当x=2028时,y
0.020
0.015
-0.311×2028+835.265=204.557≈204.56.
0.005
故预测2028年冠军队的成绩为204.56秒.
2535455565758595业务量/单
·104·
第一部分
一轮单元复习第六单元
(1)随机选取一天,估计这一天该平台的骑手
满意度评
「50,60)「60,70)「70,80)「80,90)
[90,100]
人均日业务量不少于65单的概率;
分分组
(2)若骑手甲、乙、丙选择了日工资方案①,
频数
2
8
14
10
6
丁、戊选择了日工资方案②,现从上述5名骑
(1)在图②中作出B地区用户满意度评分的
手中随机选取2名,求至少有1名骑手选择
频率分布直方图,并通过直方图比较两地区
日工资方案②的概率;
满意度评分的平均值及分散程度(不要求计
(3)若仅从人均日收入的角度考虑,请你利用
算出具体值,给出结论即可)
所学的统计学知识为新聘骑手做日工资方案
B地区用户满意度评分的频率分布直方图
频率
的选择,并说明理由.(同组中的每个数据用
组距↑
该组区间的中点值代替)
0.040
0.035
0.030
0.025
0.020
0.015
0.010
0.005
0
50
60708090100满意度评分
(2)根据用户满意度评分,将用户的满意度分
为三个等级:
满意度评分
低于70分
70分到89分
不低于90分
满意度等级
不满意
满意
非常满意
估计哪个地区用户的满意度等级为不满意的
概率大?说明理由
2.某公司为了解用户对其产品的满意度,从A,
B两地区分别随机调查了40个用户,根据用
户对产品的满意度评分,得到A地区用户满
意度评分的频率分布直方图和B地区用户
满意度评分的频数分布表,
A地区用户满意度评分的频率分布直方图
频率
组距
0.040
0.035
0.030
0.025
0.020
88
0.005
0
405060708090100满意度评分
B地区用户满意度评分的频数分布表
·105.
艺考一本通数学
3.2020年12月31日,国务院联防联控机制发
有确定2(C1十x6),c十x2十x3十x4的大小
布,国药集团中国生物的新冠病毒灭活疫苗
关系,所以无法判断,n的大小,例如:1,
已获药监局批准附条件上市,其保护效力达
2,3,4,5,6,可得m=n=3.5;例如1,1,1,
到世界卫生组织及药监局相关标准要求,现
1,1,7,可得m=1,n=2;例如1,2,2,2,2,
已对18至59岁的人提供.根据某地接种年
2,可得m=2,m是;故A错误:对于选项
龄样本的频率分布直方图(如图)估计该地接
种年龄的中位数为
B:不妨设x1≤x2≤x3≤x4≤x≤x6,可知
频率
x2,x3,x4,C5的中位数等于x1,x2,…,x6的
组距
0.040
中位数,均为工,故B正确;对于选项
0.034
2
0.030
88院
C:因为是最小值,x6是最大值,则2,
0.013
x3,x4,x5的波动性不大于x1,x2,…,x6的
波动性,即x2,x3,x4,的标准差不大于1,
01824303642485460年龄/岁
2,…,6的标准差,例如:2,4,6,8,10,12,则平
A.40
B.39
C.38
D.37
题型四
用样本的数字特征估计总体的数字
均教0一君(2+4+6十8+10+12)=7,标准差
特征
少
样本的数字特征是每年高考的重点,且多
√合[2-7y+(4-7)+(6-7+(8-7)+10-7)+12-7
与频率分布直方图、茎叶图相结合考查.主要命
105
题角度有:①数字特征的计算;②用样本的数字
3
,对于数据4,6,8,10,则平均数m=
特征解决生活中的优化问题」
}(4十6+8十10)=7,标准差。
【例4】(2023·全国乙卷)(多选)有一组样本
数据,x2,…,x6,其中0是最小值,x6是
√[4-7)+(6-7)9+8-7P+10-7
最大值,则
)
A.x2,x3,x4,C5的平均数等于C1x2,…,6
-5,显然0西>5,即>故C错误;
的平均数
对于选项D:不妨设x1≤x2≤3≤x4≤x5≤
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6
x6,则x6一x1≥x5一x2,当且仅当x1=x2,
的中位数
x=x6时,等号成立,故D正确;故选BD.
C.x2,x3,x4,C5的标准差不小于x1,x2,…,
【答案】BD
x6的标准差
【规律方法】样本数字特征及公式推广
D.x2,x3,c4,x的极差不大于1,x2,…,6
(1)平均数和方差都是重要的数字特征,是对总
的极差
体的一种简明的阐述.平均数、中位数、众数描
【解析】对于选项A:设x2,x3,x4,x的平均
述总体的集中趋势,方差和标准差描述波动
数为m,x1,x2,…,x6的平均数为n,则n
大小
m=234,5x6-2十x3十x4十
(2)平均数、方差公式的推广,若数据1,
6
_2(十x)-(x十十x十4),因为没
x2,…,xn的平均数为x,方差为s2,则数据mx1
12
十a,mx2十a,…,mxn十a的平均数为mx十a,
·106·
第一部分一轮单元复习第六单元
方差为ms2.
3.某城市100户居民的月平均用电量(单位:
变式训练四
度),以[160,180),[180,200),[200,220),
1.(2025·新课标Ⅱ卷)样本数据2,8,14,16,
[220,240),[240,260),[260,280),[280,
20的平均数为
(
300]分组的频率分布直方图如图.
A.8
B.9
C.12
D.18
,频率
十组距
2.(2023·全国乙卷)某厂为比较甲乙两种工艺
0.0125-
0.011
对橡胶产品伸缩率的处理效应,进行10次配
0.0095
对试验,每次配对试验选用材质相同的两个
0.005
橡胶产品,随机地选其中一个用甲工艺处理,
088
另一个用乙工艺处理,测量处理后的橡胶产
09
M6018020020240260280300月平均用电量/度
品的伸缩率.甲、乙两种工艺处理后的橡胶产
(1)求直方图中x的值;
品的伸缩率分别记为x,y(i=1,2,…,10)
(2)求月平均用电量的众数和中位数,
试验结果如下:
试验序号12
3
4567
8910
伸缩率x545533551522575544541568596548
伸缩率536527543530560533522550576536
记:=x:一y(i=1,2,…,10),记1,2,…,
的样本平均数为之,样本方差为s2.
(1)求z,s2;
(2)判断甲工艺处理后的橡胶产品的伸缩率
较乙工艺处理后的橡胶产品的伸缩率是否有
显著提高(如果≥2
√0,则认为甲工艺处
52
理后的橡胶产品的伸缩率较乙工艺处理后的
题型五两变量间的相关关系与统计案例
橡胶产品的伸缩率有显著提高,否则不认为
(一)回归分析
有显著提高)
【例6-1】(1)x和y的散点图如图所示,则下
列说法中所有正确的序号为
↑y
300
2500
2000
1500
1000
500
01
345678910x
①x,y是负相关关系;
②在该相关关系中,若用y=c1er拟合时的
相关系数的平方为r,用y=x+a拟合时
的相关系数的平方为r号,则>;
·107·
艺考一本通数学
③x、y之间不能建立线性回归方程,
A.我国2010一2018年未成年人犯罪比重持
(2)(2024·天津卷)下列图中,相关性系数
续下降
最大的是
(
B.与2010年相比,2019年未成年人犯罪比
。
重下降4.19个百分点
C.2019年我国未成年人犯罪的人数多于
●●
2018年
B
D.2010一2019年我国未成年人犯罪人数所
占比重的中位数为3.91%
2.(2023·全国甲卷)一项试验旨在研究臭氧效
应,试验方案如下:选40只小白鼠,随机地将
D
其中20只分配到试验组,另外20只分配到
【解析】(1)①显然正确;由散,点图知,用y
对照组,试验组的小白鼠饲养在高浓度臭氧
=c1er拟合的效果比用y=bx十a拟合的
环境,对照组的小白鼠饲养在正常环境,一段
效果要好,故②正确;x,y之间能建立线性
时间后统计每只小白鼠体重的增加量(单位:
回归方程,只不过预报精度不高,故③不正
g).试验结果如下:
确.故答案为①②,
对照组的小白鼠体重的增加量从小到大排
(2)观察4幅图可知,A图散,点分布比较集
序为
中,且大体接近某一条直线,线性回归模型
15.218.820.221.322.523.2
拟合效果比较好,呈现明显的正相关,值
25.826.527.530.132.634.3
相比于其他3图更接近1.故选A.
34.835.635.635.836.237.3
【答案】(1)①②(2)CD
40.543.2
【规律方法】最小二乘估计的三个步骤
试验组的小白鼠体重的增加量从小到大排
(1)作出散点图,判断是否线性相关.
序为
(2)如果是,则用公式求a,b,写出回归方程.
7.89.211.412.413.215.516.5
(3)根据方程进行估计.
18.018.819.219.820.221.6
【注意】回归直线方程恒过,点(x,y)
22.823.623.925.128.232.3
变式训练五(一)
36.5
1.国家统计局2021年1月的统计数据显示,我
(1)计算试验组的样本平均数;
国2010一2019年未成年人犯罪人数所占比
(2)(ⅰ)求40只小白鼠体重的增加量的中位
重如图所示,则下列说法不一定正确的是
数m,再分别统计两样本中小于m与不小于
(
m的数据的个数,完成如下列联表
2010-2019年未成年人犯罪人数所占比重
10
<m
≥m
6.786.40
5.44
对照组
824.263.56293
2582.412,59
试验组
2010201120122013201420152016201720182019年份
(iⅱ)根据(i)中的列联表,能否有95%的把握
·108·
第一部分一轮单元复习第六单元
认为小白鼠在高浓度臭氧环境中与在正常环
销费用多少万元.(结果精确到0.01)
境中体重的增加量有差异?
参考数据:
附:K2
n(ad-bc)2
2(-1(-3》=4.
(a+b)(c+d)(a+c)(b+d)'
2a-11y=340
∑(y-3)2=16.5,
P(K≥k)
0.1000.0500.010
√340≈18.44,√16.5=4.06,其中x:,y:分别
2.7063.8416.635
为第i个月的促销费用和产品销量,i=1,2,
3,…,8.
参考公式:(i)样本(c,以)(i=1,2,…,n)的相
2(5-0(y-
关系数r
x--
(i)对于一组数据(01,y),(x2,y2),…,
(In,yn),
其回归方程方
空x-3-
-,a =y-bx.
-
3.随着网络的发展,网上购物越来越受到人们
的喜爱,各大购物网站为增加收入,促销策略
越来越多样化,促销费用也不断增加,下表是
某购物网站2017年1一8月促销费用x(万
元)和产品销量y(万件)的具体数据
月份
2
3
4
5
6
7
8
促销费用x
2
3
61013
21
15
18
产品销量y
11
233.5
5
4
4.5
(1)根据数据绘制的散点图能够看出可用线
性回归模型拟合y与x的关系,请用相关系
数r加以说明;(系数精确到0.001)
(2)建立y关于x的回归方程y=bx+a(系
数精确到0.01),如果该公司计划在9月份
实现产品销量超6万件,预测至少需投入促
·109·1
PAB=4-日,故ABD正确,C错误,故选ABD
P(A3)1
4
7.A【解析】已知2位女同学和2位男同学走出的所有可能
顺序有(女,女,男,男),(女,男,女,男),(女,男,男,女),
(男,男,女,女),(男,女,男,女),(男,女,女,男),所以第2
位走出的走男同学的概率P=号-合故选A
&.ABD【解析]时于A,由题意可得PA=兰=合,P(B)=
4
是=,PCAB)=子,所以PAB)=PAP(B,故A正
疏对于BPC=号-7PA0=PaG=智
=PC=梁=号,所以PA1O=PCA,故
B正瑞;对于C,因为PABC)=,P(A)P(BP(CO)=×
合X号-=日所以PABC)≠PAPPO,故C精
对于D,因为PBO)=},所以P(BC)=P(B)P(C.故D
正确.故选ABD.
9.BC【解析】若正确选项的个数为2个,则有(1,2),(1,3),
(1,4),(2,3),(2,4),(3,4)共6种组合,每种组合为正确答
案的概率为了×日=西若正璃选项的个数为3个,则有
(1,2,3),(1,2,4),(1,3,4),(2,3,4)共4种组合,每种组合
为正确答案的概率为了×=立:若正骑选项的个数为4
个,则有(1,2,3,4)共1种组合,这种组合为正确答案的概率
为行随便选了三个选项,能完全答对这道题的概率为2
A错误:1选项是正确选项的概率为3X品十3X位十
1
日-子>?B正确:1选项为正喷递项为率件A,由B选
项知,P(A=子,正确选项有3个为事件B,则P(BA)
空-占,C至1或项为件溪线项为半外C
1
P(AB)
P(A)
3
4
P(O=子,正确选项有2个为事件D,则P(DC)=PC咒
P(C)
3X8=名,D错误.
三
1
3
4
10.需【解析】诺第一轮在第一轮中得1分,若第一轮中甲抽
到的小球为1,3,则乙抽到的小球只能是2,若第一轮中甲
抽到的小球为1,4,则乙抽到的小球可以是2或3,若第一
轮中甲抽到的小球为2,3,则乙抽到的小球可以是1或4,
若第一轮中甲抽到的小球为1,5或者2,4或者2,5或者3,
4或者3,5或者4,5时,则乙抽到的小球可以是剩下三个
小球中的任何一个,故共有6×3=18,因此第一轮中甲得1
分的概率为1十18-器在第二轮的过程中,只剩下
CC
两个球,要使甲在第二轮中得1分,只需要甲在剩下两个球
中抽到号码大的球即可,故概率为2,因此甲在两轮中共
参考答案·数学
得2分的概率为7×铝-器故答案为器
第17讲抽样方法与总体分布的估计
【典例变式】
变式训练一
1.A【解析】根据系统抽样的规则—“等距离”抽取,也就
抽取的号码差相等,根据抽出的序号可知学号之间的差为
8,所以在19与35之间还有27.
2B【解析】由题意,这批来内夹谷约为1534×器≈
169(石).
3.B【解析】样本间隔为1000÷200=5,因为122÷5=24余
2,故抽取的余数应该是2的号码,116÷5=23余1,927÷
5=185余2,834÷5=166余4,726÷5=145余1.
4.B【解析】在购买“化妆品”这一类中抽取了116人,则在购
买“家居月品”这一美中应袖取的问卷份教为,则6
=94000,解得x=94.
变式训练二
1.B【解析】因为50名学生中有女生20名,按男女比例用分
层抽样的方法,抽到的女生有4名,所以本次调查抽取的人
数是50×易=10,故选B
2.B【解析】设高三人数为x,由480+(30十x)十x=1290
可得x=390,分层抽样为按比例抽样则样本中的高三学生
人数为8×96=78故选B
3.B【解析】设北面人数为x,根据分层抽样,可得
干748+9205解得=810人.故选R
变式训练三
1.【解析】(1)由图知,该平台的骑手人均日业务量不少于65单
的频率为0.2十0.15十0.05=0.4,所以随机选取一天,估计
这一天该平台的骑手人均日业务量不少于65单的概率
为0.4.
(2)因为从5名骑手中随机选取2名的基本事件总数=C
=10,至少有1名骑手选择日工资方案②的基本事件个数m
二CC+C=7所以所求报奉P-只-品
(3)由图知,该平台的骑手人均日业务量的平均数是30×
0.05+40×0.05+50×0.2+60×0.3+70×0.2+80×0.15
+90×0.05=62(单),所以方案①的日工资约为50+62×3
=236(元),方案②的日工资约为100+(62一44)×5=190
(元),故新聘骑手应选择方案①.
2.【解析】(1)如图所示.
B地区用户满意度评分的频率分布直方图
频率
组距↑
0.040
0.035
0.030
0.025
0.020
0.015
0.010
0.005
0
5060708090100满意度评分
通过两地区用户满意度评分的频率分布直方图可以看出,B
地区用户满意度评分的平均值高于A地区用户满意度评分
的平均值:B地区用户满意度评分比较集中,而A地区用户
满意度评分比较分散.
(2)A地区用户的满意度等级为不满意的概率大.记C表示
27
艺考一本通数学
事件:“A地区用户的满意度等级为不满意”:CB表示:“B地
区用户的满意度等级为不满意”.由直方图得P(C)的估计
值为(0.01十0.02+0.03)×10=0.6,P(C)的估计值为(0.
005+0.02)×10=0.25.
所以A地区用户的满意度等级为不满意的概率大.
3.C【解析】年龄位于[18,24)的频率为0.013×6=0.078,年
龄位于[24,30)的频率为0.023×6=0.138,年龄位于[30,
36)的频率为0.034X6=0.204,年龄位于[36,42)的频率为
0.040×6=0.240,因为0.078+0.138+0.204=0.420.5,
而0.078+0.138+0.204+0.240=0.42=0.66>0.5,所以
中位数位于[36,42),设中位数为x,则0.078十0.138+0.
204十(x一36)×0.04=0.5,解得x=38.故选C.
变式训练四
1.C【解析】样本数据2.8,14.16,20的平均数为
2+8+14+16+2060=60=12.故选C.
5
2.【解析】
(1)元=545+533+551+522+575+54+541+568+596+548
10
=552.3,
y=536+527+543+530+560+533+522+550+576+536
10
=541.3,
2=x-y=552.3-541.3=11,
≈=x-y的值分别为:9,6,8,-8,15,11,19,18,20,12,
故2=
9-11+(6-11)+8-11十长-8-11十女15-11+0+19-11十(18-11+20-11y+12-11
0
=61
2
(2)(1)知:=11,2√6=26=/24,4,故有≥
2N10'
所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理
后的橡胶产品的伸缩率有显著提高
3.【解析】(1)由(0.002+0.0095+0.011+0.0125+x+0.005
+0.0025)×20=1得x=0.0075,
所以直方图中x的值为0.0075.
(2)月平均用电量的众数是220240=230.
2
因为(0.002+0.0095+0.011)×20=0.45<0.5,
(0.002+0.0095+0.011+0.0125)×20=0.7>0.5,所以
月平均用电量的中位数在[220,240)内,设中位数为a,则
(0.002+0.0095+0.011)×20+0.0125×(a-220)=0.5,
解得a=224,即中位数为224.
变式训练五(一)
1.C【解析】我国2010~2018年未成年人犯罪比重持续下
降,故A选项正确:与2010年相比,2019年未成年人犯罪比
重下降为6.78一2.59=4.19个百分点,故B选项正确;由于
所有犯罪的人数未知,虽然2019年未成年人犯罪人数所占
比重大于2018年,但无法确定2019年我国未成年人犯罪的
人数是否多于2018年,故C选项不一定正确:2010~2019
年,犯罪人数所占比重从小到大依次为2.41%,2.58%,
2.59%,2.93%,3.56%,4.26%,4.82%,5.44%,6.40%,
6.78%,由中位数的定义可知,我国未成年人犯罪人数所占
比重的中位教为3.56%)426必=3.91%,故D选项正确。
2
故选C.
2.【解析】(1)试验组样本平均数为:
20(7.8+9.2+11.4+12.4+13.2+15.5+16.5+18.0+
18.8+19.2+19.8+20.2+21.6+22.8+23.6+23.9+
28
25.1+28.2+32.3+36.5)=20=10.8
(2)()依题意,可知这40只小鼠体重的中位数是将两组数
据合在一起,从小到大排后第20位与第21位数据的平均
数,故第20位数据为23.2,第21位数据为23.6,所以m=
23.2+23.6
2
=23.4,故列联表为:
m
2≥1
合计
对照组
6
14
20
试验组
14
6
20
合计
20
20
40
(i)由(i)可得,K=
40×(6×6-14×14)2
=6.400>3.841,
20×20×20×20
所以能有95%的把握认为小白鼠在高浓度臭氧环境中与在
正常环境中体重的增加量有差异.
3.【解析】(1)由题意可知x=11,y=3,将数据代入r=
之(x-五)0一
74.5
二,
得r≈18.44X4.06
(x-x)2
74.5
74.8664≈0.995.
因为y与x的相关系数近似为0.995,说明y与x的线性相关
性很强,从而可以用线性回归模型拟合y与x的关系.(需要
突出“很强”,若有“一般”或“较弱”字样不给分)
2》将教据代入=之Ga2(y-》
2,得6=74.5=0.219,
2(x-x)2
340
a=y-x=3-0.219×11≈0.59,所以y关于x的回归方
程为y=0.22x+0.59.由y=0.22x+0.59>6,解得x
24.59,即至少需要投入促销费用24.59万元,
4【解析】(1)依题意,元=1+2+3+4十5=3,=
0.4+07+1+1.4+1.5=1,∑(m-D(y-)=2.9,
5
∑(-)2=4+1+1+4=10,6=
∑(x,-x(y-
∑(x-
=0.29,故a=y-bx=1-0.29×3=0.13,故所求线性回
归方程为y=0.29x十0.13.
(2)依题意,新车花费:
5年花费
3,5)
5,7)
[7,9)
[9,11)[11,13)[13,15
/万元
人数
60
100120
40
60
20
频率
0.150.250.30.1
0.150.05
依题意,x=4×0.15+6×0.25+8×0.3+10×0.1+12×
0.15+14×0.05=8,s2=0.15×(-4)2+0.25×(-2)2十
0.1×22+0.15×42+0.05×62=8.
5.(1)散点图见解析,y=mex+:(2)y=10×e-x十0.8
【解析】(1)散点图如图,
/微克
2
012345x/次数
用y=mex十n作为清洗x次后1千克该蔬菜残留的农药
量的回归方程类型
∑(w:-)(y-
(2)由题知m=
0.9=10,n=y-m
0.09
∑(w:-)
w=2-10×0.12=0.8,故所求的回归方程为y=10×ex+
0.8.
变式训练五(二)】
1.A【解析】根据独立性检验的定义,由K≈7.8>6.635可
知,我们有99%以上的把握认为“爱好该项运动与性别有
关”.故选A
2.【解析】(1)依题意,2×2列联表如下:
视频从业人员
Sora的应用情况
合计
减少
未减少
应用
54
18
72
没有应用
36
42
78
合计
90
60
150
零假设H。为:Sora的应用与视频从业人员的减少独立,
Sora的应用前后视频从业人员无差异,由列联表中数据得,
X=150X528×36L-6≈12.981>10.828.根
72×78×90×60
52
据小概率值a=0.001的X的独立性检验,推断H不成立,
所以有99.9%的把握认为Sora的应用与视频从业人员的减
少有关;
(2)(i)设A:=“员工第i轮获得优秀”(i=1,2,3),且A,相互
独立.设B=“员工经过培训能应用Sora”,则P(B)=P
A,AA)+P不AA)+PA石A)+PAA不)=号
××号+号×号×+号×号×号+号××号
号,故员工经过培训能应用S0a的概率是号
(i)设视频部调x人至其他部门,x∈N,X为培训后视频部
能应月用S0a的人数,则X~B(100-,号),因此E(X)
10,工,调整后视频部的年利润为10,工×10十
2
2
(1-号)100-x)×6-(100-x)=(700-7)(万元),令
700-7x≥100×6,解得≤109≈14.3,又x∈N,所以xm
7
=14.因此,视频部最多可以调14人到其他部门.
【基础训练】
1.C【解析】因为该地区经过一年的新农村建设,农村的经济
收入增加了一倍,不妨设建设前的经济收入为,则建设后
的经济收入为2,A选项,从扇形统计图中可以看到,新农
村建设后,种植收入比建设前增加2m×37%一m×60%=m
×14%,故A正确;B选项,新农村建设后,其他收入比建设
前增加2mX5%一mX4%=mX6%>mX4%,即增加了
倍以上,故B正确:C选项,养殖收入的比重在新农村建设前
与建设后相同,但建设后总收入为之前的2倍,所以建设后
的养殖收入也是建设前的2倍,故C错误;D选项,新农村建
设后,种植收入在经济收入中所占比重由建设前的60%降
为37%,故D正确.故选C.
2.C【解析】数据,,…,x10,2的平均值为2,方差为1,
故7[(m-2)2+(m-2)2+…+(x0-2)2+(2-2)2]=
1,数据1,2,…,xn的方差2=0[(m一2)2+(2-2)2+
…十(x1一2)]>1,故相对于原数据变得比较不稳定,选C.
参老答案·数学
3.B【解析】先将每个年级的人数凑整,得高一:1800人,高
二:1600人,高三:1500人,则三个年级的人数占总人数的比
181615
创分别为,的丽因此,各年级抽取人数分别为98X9
=36,98×8=32,98×38=30,故选B
4.C【解析】由题意,0.06×5+x×0.1=0.5,所以x为2,所
以由图可估计样本重量的中位数是12,故选C.
5.C【解析】由题意得,(0.004+a十0.022+0.028+0.022+
0.018)×10=1,解得a=0.006.对于选项A,成绩在[40,
70)内的频率为(0.004十0.006十0.022)×10=0.32,成绩在
40,80)内的频率为(0.004+0.006+0.022+0.028)×10=
0.6,故中位数在[70,80)间,但样本成绩在[70,80)间的可能
均为74分,故中位数不一定大于75,所以选项A错误;对于
选项B,由极差的定义知,学生成绩的极差介于40至60之
间,所以选项B错误:对于选项C,由平均数的定义知,学生
成绩的平均成绩为(45×0.004+55×0.006+65×0.022+
75×0.028+85×0.022+95×0.018)×10=76.2,介于70
至80之间,所以选项C正确;对于选项D,由于成绩不低于
60分的频率为0.18十0.22×2+0.28=0.9,所以成绩不低
于60分的人数是1500×0.9=1350,所以选项D错误.故
选C
6.B【解析】由表格中数据可得,x=4,y=50,所以50=4×
10.2十a,解得a=9.2,所以回归方程为y=10.2x+9.2,所
以当x=10时,y=10.2×10十9.2=111.2,即预测广告费为
10万元时销售额约为111.2万元,故选B.
7.D【解析】由图可知,收入最高值为90万元,收入最低值
为30万元,其比是3:1,故A正确:由图可知,结余最高为7
月份,为80一20=60,故B正确;由图可知,1至2月份的收
入的变化率与4至5月份的收入的变化率相同,故C正确;
由图可知,前6个月的平均收入为日(40+60十30+30十
50+60)=45万元,故D错误,故选D.
8C【解析】因为=(i十+对十-16)=
1
[(x1-元)2+(x2-元)2+(x3-元)2+(x4-x)2],所以27(x1
+x2+x3+x4)一4z2=16,所以872一42=16,7=2,即x1
+x十0十4=8,所以+2+十2+西+2+4十2=4,
4
故选C
9.AB【解析】由题得10×(0.005十x十0.035+0.030+0.
010)=1,解得x=0.020,故A正确:在频率分布直方图中,
前三个小长方形的面积和为0.6,前四个小长方形的面积和
为0.9,所以这组数据的第80百分位数约为80十号×10≈
86.67,故B正确:这组数据的平均数的估计值为10×(55×
0.005+65×0.020+75×0.035+85×0.030+95×0.010)
=77,故C不正确:由频率分布直方图可知,得分在[50,70)
内的频率为0.005×10+0.020×10=0.250.50,得分在
[50,80)内的频率为0.005×10+0.020×10+0.035×10=
0.60>0.50,则中位数在[70,80)内,所以这组数据的中位数
的估计值为70十0,5025×10≈7.14,故D不正确.故
0.35
选AB.
10.144【解析】由题意得,这批产品的此项质量指标的平均
数为20×0.1+40×0.6+60×0.3=44,故方差为
(20-44)2×0.1+(40-44)2×0.6+(60-44)2×0.3
=144.
11.(1)认为是否喜欢网上买菜与年龄有关系,此推断犯错误的
概率不大于Q05(2)号(3)X的数学期望E(X)=6,方
差DX)-号,Y的数学期望E)=15,方差D)=9
5
29
艺考一本通数学
【解析】(1)统计假设H:该社区的居民是否喜欢网上买菜
与年龄无关系,由给定的2×2列联表,得X
100×(40×30-10×20)=100>3.841.根据小概率值a
50×50×60×40
6
=0.05的独立性检验,否定假设H,,即认为是否喜欢网上
买菜与年龄有关系,此推断犯错误的概率不大于0.05:
(2)设A表示周i在A平台买菜,B:表示周i在B平台买
菜,i=1.2.由题可得P(A)=P(B)=号,P(BA)
号,P(B:B)=号.由全概率公式,小张周二选择在B平
台买菜的概率P(B2)=P(A1)P(B2A1)+P(B1)P(B2|
B)=×号十日×号-易:(3)猴题意,社区居民喜
欢网上买莱的概率估计位为需=是从滨社区随机物取
10名居民,其中喜欢网上买菜的居民人数XB(10,号),
所以X的教学期望E(X)=10X号=6,方差DX)=10X
号×(1-是)=号.又Y=2X+3,所以Y的数学期塑E
5
(Y)=2EX)+3=15,方差D(Y)=4DX)=s
12.1)答案见解析(2)卫,=号+号(-号)(3)最大值为
子最小值为分
【解析】(1)由折线图中数据和附注中参考数据得i=4,
2a--8/y-=a2.4-0
-)=∑y-1∑y=68.35-4×16.17=3.67,所以
3.67
相关系数r=0.72X2X2.646≈0.9632,因为y与1的相关
系数近似为0.9632,说明y与t的相关程度相当高,从而可
以用线性回归模型拟合》与y的关系.
(2)依题意得,P.=3P1+号P-(≥3),其中P=3,
P,=3×g+号-名,则卫-卫1=-号(P1-P)
(n≥3),所以P。-P,}是以首项为P,-P,=号,公比为
号的等比数列,故P.-P1=号(-号)(n≥2)成
立,则有P.-P1十P-2-P+…+P-P=号
[(-号)°+(号)+(号)++(-号)]=
X二盖C》所以=A+
-告(号),又P=子,则R.=子+告-吉
()=是+(号
《③)当u为偶教时,P,=号十号(号)”,单洞递减,最大值
为P=弓十,P.号当n为奇数时,P.=昌一号
(号)广,单调递增,最小值为卫=号十o©,P,→号,所
以数列P,的最大值为号,最小值为子
30
第18讲排列组合、二项式定理
【典例变式】
变式训练一
1.B【解析】发言的3人来自3家不同企业且含甲企业的人
的情况有CC=20(种):发言的3人来自3家不同企业且
不含甲企业的人的情况有C=10(种).所以发言的3人来
自3家不同企业的可能情况共有20+10=30(种),故选B.
2.A【解析】若α2=2,则百位数字只能选1,个位数字可选1
或0.“凸数”为120与121,共2个.若a2=3,则“凸数”有2×
3=6(个).若2=4,满足条件的“凸数”有3×4=12(个),
…,若a2=9,满足条件的“凸数”有8X9=72(个).所以所有
凸数有2+6+12+20+30+42+56+72=240(个).
变式训练二
1.C【解析】将4个1和2个0随机排成一行,可利用插空法,
4个1产生5个空,若2个0相邻,则有C种排法:若2个0
不相邻,则有C号=10种排法,所以2个0不相邻的概率为
102
5+10-3.故选C
2.D【解析】初中部和高中部总共有400+200=600(人),按
照分层抽料的原星,应从初中亦抽取器×60=40(人),从
高中部抽取器×60=40(人),第一步:从初中部抽取40人,
有C8种方法,第2步:从高中部抽取20人,有C8种方法,
根据分步计数原理,一共有C·C鄂种方法;故选D.
3.24112【解析】由题意知,选4个方格,每行和每列均恰有
一个方格被选中,则第一列有4个方格可选,第二列有3个
方格可选,第三列有2个方格可选,第四列有1个方格可选,
所以共有4X3X2×1=24种选法;每种选法可标记为(a,b,
c,d),a,b,c,d分别表示第一、二、三、四列的数字,则所有的
可能结果为:(11,22,33,44),(11,22,34,43),(11,22,33,
44),(11,22,34,42),(11,24,33,43),(11,24,33,42),(12,
21,33,44),(12,21,34,43),(12,2231,44),(12,22,34,40),
(12,24,31,43),(12,24,33,40),(13,21,33,44),(13,21,
34,42),(13,22,31,44),(13,22,34,40),(13,24,31,42),
(13,24,33,40),(15,21,33,43),(15,21,33,42),(15,22,
31,43),(15,22,33,40),(15,22,31,42),(15,22,33,40),所
以选中的方格中,(15,21,33,43)的4个数之和最大,为15
+21+33+43=112.故答案为24:112.
变式训练三
1.80【解析】由通项公式T+1=Cg·2-r·x-·(一1)=
Cg·(-1)”·2-r2x-,令5-r=3,得r=2,可得x3项的
系数为Cg·(-1)2·2-2=80.故答案为80.
2.A【解析(2-x)的展开式的通项公式为T,+1=C·2-
·(一1)”·x,则1X(2一x)4的展开式中含有x的项为C
·21·(-1)3·x3=-8x3,a.x2×(2-x)4的展开式中含有
x3的项为a.x2×C·23·(-1)1·x=-32ax3,则-8
32a=8,解得a=合故选A
3.C【解析】令x=1,可得a十1=2,所以a=1,所以
(ax+7)(2x-1)=(x+之)(2x-1)5,则展开式中常数项
为(2x一1)5展开式中x项的系数,即2C(一1)4=10.故
选C
4.12【解答近-二)的二项展开式的中,只有第5项的
二项式系数最大,所以n=8,通项公式为T,+1=C·(一2)
·→=(-2C心·中,令8=0,求得r=2,可符
二项展开式中常数项等于4×C%=112.
5.C【解桥】(x2+二-2)表示5个因式(x2+-2)的乘