内容正文:
第一部分假期作业六统计与统计案例
假期作业六
统计与统计案例
用样本估计总体
…0
练基础题0…
知识点二
:3.已知一个样本容量为7的样本的平均数为
知识点一随机抽样
5,方差为2,现样本加人新数据4,5,6,此时
1.某初级中学有学生300人,其中初中一年级
样本容量为10,若此时平均数为x,方差为
120人,初中二、三年级各90人,现要利用抽
2,则
(
)
样方法抽取10人参加某项调查,将学生按
A.x=5,s2=5
B.x=5,s2=1.6
初中一、二、三年级依次统一编号为1,2,…,:
C.x=4.9,s2=1.6
300,考虑选用简单随机抽样、分层抽样和系
D.x=5.1,s2=2
统抽样三种方案,如果抽得号码有下列四种
4.国家统计局服务业调查中心和中国物流与
情况:
采购联合会发布的2018年10月份至2019
①30,60,90,120,150,180,210,240,270,
年9月份共12个月的中国制造业采购经理
290;
指数(PMI)如图所示.则下列结论中正确
②11,41,71,101,131,161,191,221,251,
的是
281;
(%50%表示与上月比较无变化
54
③5,9,100,107,121,151,181,228,258,
好
288;
④7,37,67,97,127,157,187,217,247,277.
50.2500
50.5
So/
50.1
9
关于上述样本的下列结论中,正确的是(
49
9.5492
49.449.449.749.5498
A.②、④都不能为分层抽样
4
2臂月片2092明明阴朝6朗阴朗明
B.①、③都不能为系统抽样
A.12个月的PMI值不低于50%的频率为
C.①、④都可能为系统抽样
D.②、③都不能为简单随机抽样
3
2.(多选)2022年第二十二届世界杯足球赛在
B.12个月的PM1值的平均值低于50%
卡塔尔举行,这是第一次在阿拉伯地区举
C.12个月的PMI值的众数为49.5%
办,第一次在北半球冬季举办,也是最后一
D.12个月的PMI值的中位数为50.3%
届32支球队参加的世界杯赛,它吸引了全
世界的目光.现使用分层抽样的方法,从到:
5.(多选)现有一组数据:1,3,4,7,1011,
则
场观看世界杯某场比赛的球迷中随机抽取n:
A.这组数据的平均值为6
名,其中亚洲、欧洲、非洲、美洲球迷人数的:
B.这组数据的中位数为5.5
比例为2:4:3:1,若亚洲球迷抽到12人,
C.这组数据的75%分位数为7
则下列选项不正确的是
A.非洲球迷抽到15人
D.对任意x∈R,[(x
-1)2+(x-3)2十
B.美洲球迷抽到8人
(x-4)2+(x-
7)2+(x-10)2+(x
C.n=56
D.欧洲球迷比美洲球迷多18人
11)2引的最小值为这组数据的方差
15
高二数学每日一练·练出好成绩
知识点三成对数据的统计分析
A.x2,x3,x4,x5的平均数等于x1,x2,…,
6.某单位为了了解办公楼用电量y(度)与气温x
x6的平均数
(℃)之间的关系,随机统计了四个工作日的用:
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6
电量与当天平均气温,并制作了对照表:由表
的中位数
中数据得到线性回归方程y=-2x十a,当气
C.x2,x3,x4x5的标准差不小于x1,x2,…,
温为一3℃时,预测用电量为
(
x6的标准差
气温x(℃)
18
13
10
D.x2,x3,x4,x5的极差不大于x1x2…,x6
用电量y(度)
24
34
38
64
的极差
A.68度
B.66度
C.28度
D.12度
9.(2022·天津卷)为研究某药品的疗效,选取
7.已知某次考试之后,班主任从全班同学的成
若干名志愿者进行临床试验,所有志愿者的
绩中随机抽取一个容量为8的样本,他们的
舒张压数据(单位:kPa)的分组区间为[12,
数学、物理成绩(单位:分)如下表所示,
13),[13,14),[14,15),[15,16),[16,17],
学生编号
2
65
7
将其按从左到右的顺序分别编号为第一组,
数学成绩(分)
60
70
75
80
85
90
95
第二组,…,第五组,右图是根据试验数据制
物理成绩(分)
72
77
8084
88
90
93
95
成的频率分布直方图.已知第一组与第二组
再给出如图所示的散点图.
共有20人,第三组中没有疗效的有6人,则
物理成绩/分
100
第三组中有疗效的人数为
90
频率
80
组距
70
0.36
60
0.24
50
060708090100数学成绩/分
0.16
0.08
根据以上信息,有下列三个说法:
121314151617舒张压/kPa
①根据散点图,可以判断数学成绩与物理成
A.8
B.12
C.16
D.18
绩具有线性相关关系;
②根据散点图,可以判断数学成绩与物理成
10.(2023·新课标Ⅱ卷)某研究小组经过研究
绩具有一次函数关系;
发现某种疾病的患病者与未患病者的某项
③从全班随机抽取甲、乙两名同学,若甲同:
医学指标有明显差异,经过大量调查,得到
学数学成绩为80分,乙同学数学成绩为60
如下的患病者和未患病者该指标的频率分
分,则甲同学的物理成绩一定比乙同学的物
布直方图:
理成绩高
4频率/组距
其中,正确的说法为
(写出所有满
0.040
0.036
足条件的说法序号)
0.034
…0
练高考题o…
0.012
8.(多选)(2023·新课标I卷)有一组样本数
0.002
指标
据x12…,x6,其中x1是最小值,x6是最
0
95100105110115120125130
大值,则
患病者
16
第一部分假期作业六统计与统计案例
↑频率/组距
练综合题
0.040
0.038
0.036
0.034
11.学校为了解高二学生每天自主学习中国古
典文学的时间,随机抽取了高二男生和女
生各50名进行问卷调查,其中每天自主学
习中国古典文学的时间超过3小时的学生
0.010--
称为“古文迷”,否则为“非古文迷”,调查结
0.002
指标
0707580859095100105
果如下表:
未患病者
古文迷
非古文迷
合计
利用该指标制定一个检测标准,需要确定:
男生
26
24
50
临界值c,将该指标大于c的人判定为阳:
女生
30
20
50
性,小于或等于c的人判定为阴性.此检测
合计
56
44
100
标准的漏诊率是将患病者判定为阴性的概
率,记为(c);误诊率是将未患病者判定为
(1)根据上表数据判断能否有60%的把握
阳性的概率,记为q(c).假设数据在组内均:
认为“古文迷”与性别有关?
(2)现从调查的女生中按分层抽样的方法
匀分布,以事件发生的频率作为相应事件
抽出5人进行理科学习时间的调查,求所
发生的概率,
抽取的5人中“古文迷”和“非古文迷”的
(1)当漏诊率p(c)=0.5%时,求临界值c
人数
和误诊率g(c);
n(ad-bc)2
(2)设函数f(c)=p(c)+q(c),当c∈[95,
参考公式:K2=
(a+b)(c+d)(a+c)(b+d)
105]时,求f(c)的解析式,并求f(c)在区间:
其中n=a十b+c+d.
[95,105]的最小值.
参考数据:
P(K2≥
0.5000.4000.250
0.0500.0250.010
k0)
ko
0.455
0.7081.321
3.8415.0246.635
17
高二数学每日一练·练出好成绩
(3)设B=“任选一人年龄位于区间[40,
经典再现。
50)”,C=“从该地区中任选一人患这种疾
题点频率分布直方图
病”,
例■
在某地区进行流行病学调查,随机调查
则由已知得:
了100位某种疾病患者的年龄,得到如下的
P(B)=16%=0.16,P(C)=0.1%=0.01,
样本数据的频率分布直方图:
P(B|C)=0.023×10=0.23,
频率组距
0.023
则由条件概率公式可得
0.020
从该地区中任选一人,若此人的年龄位于区
0.017F---
间[40,50),此人患这种疾病的概率为
P(BC)
P(C)P(BC)
0.012
P(CB)=
P(B)
P(B)
0.006
0.001×0.23=0.0014375≈0.0014.
0.16
0.002
答案
(1)47.9(2)0.89
(3)0.0014
0.001
0
102030405060708090年龄/岁
汇思维导引门
(1)估计该地区这种疾病患者的平均年龄:
1.解决频率分布直方图问题时要抓住3个
(同一组中的数据用该组区间的中点值为代
要点
表);
(1)直方图中各小长方形的面积之和
(2)估计该地区一位这种疾病患者的年龄位
为1.
于区间[20,70)的概率;
(3)已知该地区这种疾病的患病率为0.1%,
(2)直方图中飘钻表示经毫成每组样本
该地区年龄位于区间[40,50)的人口占该地
的频率为组距×
距,即矩形的面积。
频率
区总人口的16%.从该地区中任选一人,若
(3)直方图中每组样本的频数为频率×
此人的年龄位于区间[40,50),求此人患这
种疾病的概率.(以样本数据中患者的年龄
总体数,
位于各区间的频率作为患者的年龄位于该:
2.用频率分布直方图估计众数、中位数、平
区间的概率,精确到0.0001).
均数的方法
解析(1)平均年龄x=(5×0.001十15×
(1)众数为频率分布直方图中最高矩形
0.002+25×0.012+35×0.017+45×
底边中点横坐标。
0.023+55×0.020+65×0.017+75×
(2)中位数为平分频率分布直方图面积
0.006+85×0.002)×10=47.9(岁).
且垂直于横轴的直线与横轴交点的横
(2)设A={一人患这种疾病的年龄在区间
坐标
[20,70)},所以
(3)平均数等于每个小矩形面积与小矩
P(A)=1-P(A)=1-(0.001+0.002+
形底边中点横坐标之积的和.
0.006+0.002)×10=1-0.11=0.89.
18高二数学每日
由上述不等式有ear+ln1+ar)一er<ear+ax-ex=
e2ax-er≤0,
故h(x)≤0总成立,即h(x)在(0,十∞)上为减
函数,
所以h(x)<h(0)=0.
当a≤0时,有h'(.x)=eax-ex十a.xeax<1
1+0=0,
所以h(x)在(0,十∞)上为减函数,
所以h(x)<h(0)=0.
签上a≤:
(3)取a=分,则yx>0,总有xer-e+1<0
成立,
令t=ex,则t>1,t2=ex,x=2lnt,
2tnt1即21nt<t对任意的
恒成立
n+1
所以对任意的n∈N*,有2n,√
m十1
n
n
Vn+1'
整理得到:ln(n+l)-lnn<
1
n2+n
故1三十
1一十…十
1_>n2-ln1+
√12+1√22+2
√n2+n
In 3-In 2++...+In(n++1)-In n=In(n-1),
故不等式成立
假期作业六
1.B[若采用简单随机抽样,根据简单随机抽样的
特点,1~300之间任意一个号码都有可能出现;
若采用分层抽样,则1~120号为一年级,121~
210为二年级,211~300为三年级.且根据分层
抽样的概念,需要在1~120之间抽取10×20
300
4个,121~210与211~300之间各抽取10×90
300
=3个;若采用系统抽样,根据系统抽样的概念,
需要在1~30,31~60,61~90,91~120,121~
150,151~180,181210,211~240,241~270,
271一300之间各抽一个,且抽取完第一个之后,
后面的均应按照相等的距离或间隔抽取样本单
位.对于①,可能为简单随机抽样,且满足分层抽
05
练·练出好成绩
一●●
样要求,故也可能为分层抽样,但最后两组数据
差距为20,与前面9组数据差值30不同,故不可
能为系统抽样,对于②,可能为简单随机抽样,且
满足分层抽样和系统抽样要求,故也可能为分层
抽样或者系统抽样,对于③,可能为简单随机抽
样,且满足分层抽样特点,但数据之间不是等间
距,故不可能是系统抽样,对于④,可能为简单随
机抽样,且满足分层抽样特,点,也满足系统抽样
特点,故也可能为分层抽样或系统抽样.故选B.]
2.AC[由片243于解得m=60人,所以胺
2
4
洲抽到60X2+4十3十=24人,非洲抽到60×
3
2+4十3+=18人,美洲抽到60×2+4十3+1=6
人,欧洲球迷比美洲球迷多18人.故选ABC.]
3.B[设这10个数据分别为:x1,x2,…,x7,x8=
4,x9=5,x10=6,根据题意,1十x2十十x1
7
5→x1+x2+…+x7=35,
(.x1-5)2+(x2-5)2十…+(x7-5)2
=2→(x1
7
-5)2+(x2-5)2十…十(x7-5)2=14,所以x=
x1十x2十…十x10=35+4+5+6=5,
10
10
2=(x1-5)2+(x2-5)2+.+(x10-5)2
10
14+(4-5)2+(5-5)2+…十(6-5)2=16.故
10
选B.]
4.B[对于A,从图中数据变化看,PMI值不低于
50%的月份有4个,所以12个月的PMI值不低
于50%的复率为意号放A精误:对于B,由园
可以看出PMI值不低于50%的月份有4个且超
过不多,PMI值低于50%的月份有8个,其中2
月份数据为49.2%,低得比较多,所以PMI值的
平均值低于50%,故B正确;对于C,12个月的
PMI值的众数为49.4%,故C错误;对于D,12
个月的PMI值的中位数为49.6%,故D错误.故
选B.]
5.AD[对于A,这组数据的平均数为1+3+4什7+10+1
6
6故A正确:对于B,这组数据的中位数为47=
2
●
参考答案与详解
5.5,故B正确;对于C,该组数据是从小到大排!10.解(1)由题图知(100-95)×0.002=1%>
列的,6×0.75=4.5得,它的75%分位数为第5
0.5%,所以95<c<100,
个数10.故C错误,对于D,【x-1)2+(x-
设X为患病者的该指标,
则p(c)=P(X≤c)=(c-95)X0.002=0.5%,
3)2+(x-4)2+(x-7)2+(x-10)2十(x-
解得c=97.5.
1)】=2-12x十14,当=6时,此二次画致
设Y为未患病者的该指标,
则q(c)=P(Y>c)=(100-97.5)×0.01+5×
取最小值,最小值为智,由方差定义可知,该组数
0.002=0.035=3.5%;
(2)当95≤c≤100时,
据的方差2=合×[1-6)2+(3-6)2+4
p(c)=(c-95)×0.002=0.002c-0.19,
6)2+(7-6)2+(10-6)2+(11-6)2]=号,故
q(c)=(100-c)×0.01+5×0.002=-0.01c+
1.01,
D正确.故选ABD.]
所以f(c)=p(c)+g(c)=-0.008c+0.82;
6.B[由表中数据可知=18+13十10-1-10,
4
当100<c≤105时,
y=24+34十38+64=40,所以回归方程y=
(c)=5×0.002+(c-100)×0.012=0.012c
4
1.19,
-2.x+a过(10,40),得40=-2×10+a,即a=
q(c)=(105-c)×0.002=-0.002c+0.21,
60,则回归方程为y=一2x十60,当x=一3时,
所以f(c)=p(c)+g(c)=0.01c-0.98.
y=-2×(-3)+60=66,故选B.]
1,
综上所述,
7.①[对于①,根据散,点图知,各,点分布在一条直
fc)={-0.008c+0.82,95<c≤100
线附近,两变量间是线性相关关系,所以①正确;:
0.01c-0.98,100<c≤105
对于②,根据散点图知,两变量不是确定的一次
由一次函数的单调性知,函数f(c)在[95,100]
函数关系,所以②错误;对于③,利用概率的知识!
上单调递减,在(100,105)上单调递增,
进行预测,得到的结论有一定的随机性,所以③!
作出f(c)在区间[95,105]上的大致图象(略),
错误.故答案为:①.]
可得f(c)在区间[95,105]的最小值f(c)mim=
8.BD[取x1=1,x2=x3=x4=x5=2,x6=9,则
f(100)=-0.008×100+0.82=0.02.
x2x34x5的平均数等于2,标准差为0,x1,11.解1)由列联表得:K2=10X26X20-30X2)2
56×44×50×50
26的平均数等于3,标准差为,=Y66
3
≈0.6494<0.708,
故A,C均不正确;根据中位数的定义,将x1,x2,
所以没有60%的把握认为“古文迷”与性别
…,x6按从小到大的顺序进行排列,中位数是中
有关;
间两个数的算术平均数,由于x1是最小值,x6是
(2)由列联表知:50名女生中古文迷有30人,非
最大值,故x2,x3,x4,x5的中位数是将x2,x3,
古文迷20人,
所以按分层抽样的方法抽出5人中古文迷有
x4,x5按从小到大的顺序排列后中间两个数的:
算术平均数,与x1,x2,…,x6的中位数相等,故
5×识-3人,非古文逢有5×器-5人
50
B正确;根据极差的定义,知x2,x3,x4,x5的极
差不大于x1x2,…,x6的极差,故D正确.综上,
假期作业七
选BD.]
:1.C[对于A,当A,B是独立事件时,A,B也是独
20
9.B[志愿者的总人数为0.24+0.16)X7=50,
立李件,P(AB)=P(A)·P(E)=合×
所以第三组人数为50×0.36=18,有疗效的人数
为18-6=12.故选B.]
(-号)=日A正确:对于B当AB是对2事
55