内容正文:
高一湘教版(24-25学年)数学必修1期末考点大串讲
串讲06 统计学初步
01
02
04
03
目
录
易错易混
题型剖析
考点透视
押题预测
四大常考点、明确复习目标
十大题型典例剖析+技巧点拨+举一反三
三大易错易混经典例题+针对训练
精选期末真题对应考点练
01考点透视
02题型剖析
题型一 抽签法的应用
技巧点拨
举一反三
题型剖析
题型二 随机数法的应用
技巧点拨
举一反三
题型剖析
题型三 分层抽样的应用
技巧点拨
举一反三
题型剖析
题型四 频率分布直方图中的相关计算问题
技巧点拨
举一反三
题型剖析
题型五 百分位数在具体数据中的应用
技巧点拨
举一反三
题型剖析
题型六 百分位数在统计表或统计图中的应用
技巧点拨
举一反三
题型剖析
题型七 平均数、中位数、众数在具体数据中的应用
技巧点拨
举一反三
题型剖析
题型八 在频率分布直方图中求平均数、中位数、众数
技巧点拨
举一反三
题型九 标准差与方差的应用
题型剖析
技巧点拨
举一反三
题型十 用样本平均数和样本标准差估计总体
题型剖析
技巧点拨
举一反三
03易错易混
易错点1 忽略随机数表重复出现的数字导致错误
03易错易混
易错点2 忽略百分数由小到大依次排序导致错误
针对训练
03易错易混
易错点3 忽略众数、中位数和平均数各自意义导致错误
04押题预测
D
D
D
D
ACD
谢谢观看!
【解析】确保公平性要保证每个签抽到是等概率的,因此抽签法要做到搅拌均匀,才具有公平性.
故选:B
【解析】由于第一次剔除时采用抽签法,对每个人来说可能性相等,然后随机抽取10人对每个人的机会也是均等的,所以总的来说每个人的机会都是均等的,被抽到的可能性都是相等的.故选:B.
【解析】由题所给随机数表:从第8行第5列的数开始,按3位数依次向右读取,则牛奶抽到标号分别为:175,331,455,068,...
故第三袋牛奶的标号是:445,
故选:B
用随机数工具产生编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需的个数.
①用随机试验生成随机数;
②用信息技术生成随机数;
③用计算器生成随机数;
④用电子表格软件生成随机数;
⑤用R统计软件生成随机数.
【变式】总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第6个个体的编号为( )
7816 6572 0802 6314 0702 4369 1128 0598
A.07 B.02 C.11 D.05
【解析】由题意可知,选出的6个个体的编号分别为:08,02,14,07,11,05
故选:D.
例3、宁县二中共有学生3000人,其中高一级800人,现在全体学生中抽取一个容量为90的样本进行“学习兴趣”调查,则在高一级应抽取( )人
A.22 B.24 C.26 D.28
【解析】依题意,抽样比为,所以高一级应抽取人数为.
故选:B
(分层抽样中每层抽取的个体数的确定方法)
(1)已知总体容量、样本容量及各层的个体数时,首先确定抽样比,其中为总体容量,为样本容量;然后确定每层抽取的个体的个数,其中为第层的个体数,为第层应抽取的个体数.
(2)已知各层个体数之比为,样本容量为时,每层抽取的个体数为.
【变式】某中学有高中生1800人,初中生1200人,为了解学生课外锻炼情况,用分层抽样的方法从学生中抽取一个容量为的样本.已知从高中生中抽取的人数比从初中生中抽取的人数多24,则( )
A.48 B.72 C.60 D.120
【解析】由题意可知:分层抽样按照的比例进行抽取,
则高中生抽取的人数为:;
初中生抽取的人数为:;
因为从高中生中抽取的人数比从初中生中抽取的人数多24,则,
解得:,
故选:.
例4、某棉纺厂为了解一批棉花的质量,在该批棉花中随机抽取了容量为120的样本,测量每个样本棉花的纤维长度(单位:mm,纤维长度是棉花质量的重要指标),所得数据均在区间内,将其按组距为2分组,制作成如图所示的频率分布直方图,其中纤维长度不小于28mm的棉花为优质棉.求频率分布直方图中的值;
【解析】由频率分布直方图知,所有小矩形面积之和为1,
即,解得.
1、因为小长方形的面积=组距×=频率,所以各小长方形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
2、在频率分布直方图中,各小长方形的面积之和等于1.
3、=样本量.
4、在频率分布直方图中,各长方形的面积之比等于频率之比,各长方形的高度之比也等于频率之比.
【变式】某电子商务公司对10000名网络购物者某年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.求:
(1)直方图中的a的值;
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数.
【解析】(1)由频率分布直方图及频率和等于1可得:
,
解得.
(2)消费金额在区间内频率为,
所以消费金额在区间内的购物者的人数为.
例5、有一笔统计资料,共有10个数据如下:90,92,92,93,93,94,95,96,99,100,则这组数据的分位数为( )
A.92 B.95 C.95.5 D.96
【解析】因为,
则这组数据的分位数为该组数据的第8个,即为96.
故选:D.
(计算一组n个数据的第p百分位数的步骤)
第1步,按从小到大排列原始数据.
第2步,计算.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
【变式】某校从高一新生中随机抽取了一个容量为10的身高样本,数据(单位:cm)从小到大排序如下:158,165,165,167,168,169,x,172,173,175,若样本数据的第60百分位数是170,则x=( )
A.169 B.170 C.171 D.172
【解析】因为样本容量为10,且样本数据从小到大排序如下:
158,165,165,167,168,169,x,172,173,175,
又,
所以第60百分位数为,由已知,
所以,
故选:C.
例6、某班60名学生期中考试物理成绩的频率分布直方图如图所示,其中成绩分组区间是,,,,,则该成绩的第70百分位数约为( )
A.73.6 B.75.5 C.76.2 D.78.3
【解析】由题意可求得,
则对应的频率为,
对应的频率为,,所以第70百分位数在之间;
即第70百分位数为.
故选:D.
频率直方图计算百分位数的规律
求总体百分位数的估计,首先要从小到大排列数据,频率直方图看作数据均匀分布在直方图上,然后计算出
,当i不是整数要取整,频率直方图要计算出比例值.
【变式】下图是根据某班学生在一次数学考试中的成绩画出的频率分布直方图,则由直方图得到
的25%分位数为( )
A.66.5 B.67 C.67.5 D.68
【解析】第一组的频率为,前两组的频率之和为,
知25%分位数在第二组内,故25%分位数为.
故选:C.
例7、某学校高一年级有300名男生,200名女生,通过分层随机抽样的方法调查数学考试成绩,抽取总样本量为50,男生平均成绩为120分,女生平均成绩为110分,那么可以推测高一年级学生的数学平均成绩约为( )
A.110分 B.115分 C.116分 D.120分
【解析】由题意,应抽取男生(人),
应抽取女生(人),
所以推测高一年级学生的数学平均成绩约为(分).
故选:C
众数、中位数、平均数的意义
(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.
(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,可用中位数描述其集中趋势.
【变式】已知样本数据的平均数与中位数之差为2,则样本数据的平均数与中位数之差为( )
A.2 B.3 C.4 D.8
【解析】由题意在样本数据中,样本数据的平均数与中位数之差为2
设的平均数为,中位数为m,
则的平均数为,中位数为,
∴.
故选:C.
例8、某校举办了迎新年知识竞赛,将100人的成绩整理后画出的频率分布直方图如下,则根据频率分布直方图,下列结论不正确的是( )
A.中位数70 B.众数75 C.平均数68.5 D.平均数70
【解析】的频率为
因为最高小矩形的中点横坐标为,显然众数是75,故B正确;
的频率是0.1,的频率是0.15,的频率是0.25,其频率和为0.5,所以中位数为70,故A正确;平均数,所以C正确.故选:D.
频率分布直方图中求平均数、中位数、众数
(1)众数:频率分布直方图中,最高矩形的底边中点的横坐标.
(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x轴交点的横坐标称为中位数.
(3)平均数:平均数在频率分布直方图中等于每个小矩形底边中点的横坐标与小矩形的面积的乘积之和.
【变式】某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:,,,,,.求图中的值和学生成绩的中位数;
【解析】由频率分布直方图知:,解得:.
由,
所以中位数在区间,
设成绩的中位数为,有,解得.
例9、某工厂生产三种纪念品,每种产品都分精品型和普通型两种,某一天的产量如下表(单位:个)
纪念品A
纪念品B
纪念品C
精品型
100
150
n
普通型
300
450
600
现采用分层抽样的方法在这一天生产的纪念品中抽取200个,其中有A种纪念品40个.
(1)求n的值;
(2)从B中精品型纪念品中抽取5个,某种指标的数值如下:x,y,10,11,9,把这5个数据看做一个总体,其均值为10、方差为2,求的值.
【解析】(1)设这一天生产的纪念品为个,由题意得,,(个),
所以(个).
(2)由题得,则,由于得,
从而,,即.
在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度,在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,数据越集中,稳定性越高.
【变式】某教育集团为了办好人民满意的教育,每年底都随机邀请名学生家长代表对集团内甲、乙两所学校进行人民满意度的民主测评满意度最高分分,最低分分,分数越高说明人民满意度越高,分数越低说明人民满意度越低去年测评的结果单位:分如下
甲校:,,,,,,,
乙校:,,,,,,,
(1)分别计算甲、乙两所学校去年人民满意度测评数据的平均数、中位数
(2)分别计算甲、乙两所学校去年人民满意度测评数据的方差
【解析】(1)甲学校人民满意度的平均数为:,
甲校:86,96,97,98,100,103,108,112
甲学校人民满意度的中位数为;
乙学校人民满意度的平均数为:,
乙校:93,94,96,97,101,105,106,108
乙学校人民满意度的中位数为.
(2)甲学校人民满意度的方差:,
乙学校人民满意度的方差:.
例10、甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环).
甲
10
8
9
9
9
乙
10
10
7
9
9
如果甲、乙两人只有1人入选,你认为应如何选择?
【解析】由题意可得:甲的平均数为,甲的方差为;
乙的平均数为,甲的方差为;
∵甲、乙两人平均数相同,但,说明乙的波动性大,
故应让甲入选.
(1)标准差代表数据的离散程度,考虑数据范围时需要加减标准差.
(2)计算样本平均数、样本方差直接利用公式,注意公式的变形和整体代换.
【变式】老师安排小明和小红各自独立调查本校学生的身高情况.小红随机选取了60名学生进行调查,小明随机选取了20名学生进行调查.回答下列问题,并说明理由:
(1)小明和小红所得到的样本的平均身高是否一定相同?如果不同,哪组样本的平均身高可能更接近学校总体学生的平均身高?
(2)小明和小红所得到的样本的标准差是否一定相同?如果不同,哪组样本的标准差可能更大?
【解析】(1)因为小明和小红采用的是随机抽样的方法进行调查,所得样本数据不一样,
所以小明和小红所得到的样本的平均身高不一定相同;如果不同,因为样本数据越多受偶然值干扰就越小,
所以选取数据多的样本组,平均值可能更接近总体平均值,又小红随机抽取的样本数据比小明随机抽取的样本数据多,
所以小红选取的样本的平均身高可能更接近学校总体学生的平均身高.
(2)因为小明和小红采用的是随机抽样的方法进行调查,所得样本数据不一样,所以小明和小红所得到的样本的标准差不一定相同;如果不同,因为选取数据多的样本组,统计结果将更接近总体,其离散程度相对较小,则标准差相对较小,又小红随机抽取的样本数据比小明随机抽取的样本数据多,所以小红选取的样本的标准差可能更小,则小明选取的样本的标准差可能更大.
1.现从某学校
名同学中用随机数表法随机抽取
人参加一项活动.将这
名同学编号为
、
、
、
、
,要求从下表第
行第
列的数字开始向右读,则第
个被抽到的编号为( )
16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
A.
B.
C.
D.
【解析】从随机数表第2行第5列开始,从左到右依次选取三个数字,去掉其中重复及大于450的数,
样本的前5个个体的编号依次为175、331、068、047、447.
故选:B.
2.某校从高一新生中随机抽取了一个容量为10的身高样本,数据(单位:cm)从小到大排序如下:158,165,165,169,168,167,x,172,173,175,若样本数据的第60百分位数是170,则x=( )
A.169
B.170
C.171
D.172
【解析】因为样本容量为10,且样本数据从小到大排序如下:
158,165,165,167,168,169,x,172,173,175,
又
,所以第60百分位数为
,由已知
,
所以
,故选:C.
1.“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间
内的一个数来表示,该数越接近10表示满意程度越高,现随机抽取7位小区居民,他们的幸福感指数分别为5,6,7,8,9,5,4,则这组数据的第60百分位数是( )
A.7
B.7.5
C.8
D.9
【解析】该组数据从小到大排列为:4,5,5,6,7,8,9,且
.
所以第60百分位数是第5个数,即7.
故选:A.
3.已知
个数据分别是
,
,
,
,
,
,
,
.请确定:
(1)样本数据的平均数
的值;
(2)该数据的众数.
【解析】(1)由平均数公式可得
.
(2)由众数的定义可知,样本数据的众数为
和
.
1.(22-23高一下·天津南开·期末)一组数据:16,21,23,26,33,33,37,37的第85百分位数为( )
A.34 B.35 C.36 D.37
2.(23-24高一下·陕西·期末)中国古代科举制度始于隋而成于唐,兴盛于明、清两朝.明代会试分南卷、北卷、中卷,按的比例录取,若某年会试录取人数为200,则中卷录取人数为( )
A.150 B.110 C.70 D.20
3.(23-24高二上·黑龙江哈尔滨·阶段练习)总体由编号01,02,…,29,30的30个个体组成,利用下面的随机数选取6个个体,选取方法是从如下随机数的第1行的第6列和第7列数字开始由左向右依次选取两个数字,则选出来的第6个个体的编号为( )
第1行 78 16 62 32 08 02 62 42 62 52 53 69 97 28 01 98第2行 32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81
A.27 B.26 C.25 D.19
4.(23-24高一下·福建福州·期末)若数据、、…、的平均数是4,方差是4,数据、、…、的平均数是,标准差是,则下列结论正确的是( )
A.,B., C., D.,
5.(23-24高一下·安徽安庆·期末)若数据的平均数为3,方差为4,则下列说法正确的是( )
A.数据的平均数为13B.数据的方差为12 C.D.
$$