内容正文:
专题08 统计
一、学习目标(100%)
1、了解总体、样本、样本量的概念,了解数据的随机性;
2、了解简单随机抽样的含义及其解决问题的过程,掌握两种简单随机抽样方法;
3、会计算样本均值和样本方差,了解样本与总体的关系;
4、了解分层随机抽样的特点和使用范围,掌握各层样本量比例分配的方法,掌握分层随机抽样的样本均值和样本方差;
5、能用样本估计总体的集中趋势参数,理解集中趋势参数的统计含义;
6、能用样本估计总体的取值规律;
7、能用样本估计百分位数,理解百分位数的统计含义。
二、课前热身(20%)
1. 一支羽毛球队有男运动员20人,女运动员15人,按性别进行分层.用分层随机抽样的方法从全体运动员中抽出一个容量为7的样本.如果样本按比例分配,那么女运动员应抽取的人数为( )
A.2 B.3 C.5 D.6
2. 某校组织全校1850名学生赴山东曲阜、陕西西安和河南洛阳三地开展研究性学习活动,每位学生选择其中一个研学地点,且每地最少有100名学生前往,则研学人数最多的地点( )
A.最多有1651名学生 B.最多有1649名学生
C.最少有618名学生 D.最少有617名学生
3. 下列调查中,适合用普查的是( )
A.了解我省初中学生的家庭作业时间 B.了解“嫦娥四号”卫星零部件的质量
C.了解一批电池的使用寿命 D.了解某市居民对废电池的处理情况
4. 下图是甲、乙两地10月1日至7日每天最低气温走势图.
记这7天甲地每天最低气温的平均数为,标准差为;记这7天乙地每天最低气温的平均数为,标准差为.根据上述信息,下列结论中正确的是( )
A. B.
C. D.
5. 某校为了解学生课外阅读情况,对该校学生的年阅读量(单位:本)进行抽样调查,将调查数据整理得到如图所示的频率分布直方图,则样本数据的第25百分位数所在的区间为( )
A. B. C. D.
三、知识梳理
1、简单随机抽样
(1)简单随机抽样: 分为放回简单随机抽样和不放回简单随机抽样.除非特殊声明,本章简单随机抽样指不放回简单随机抽样.
(2)简单随机样本: 通过简单随机抽样获得的样本称为简单随机样本.
(3)简单随机抽样的常用方法
实现简单随机抽样的方法很多,抽签法和随机数法是比较常用的两种方法.
2、总体平均数与样本平均数
定义
总体均值
(总体平均数)
一般地,总体中有个个体,它们的变量值分别为,,,,则称为总体均值,又称总体平均数.
如果总体的个变量值中,不同的值共有()个,不妨记为,,,,其中出现的频率()则总体均值还可以写成加权平均数的形式
样本均值
(样本平均数)
如果从总体中抽取一个容量为的样本,它们的变量值分别为,,,则称为样本均值,又称样本平均数.
说明:(1)在简单随机抽样中,我们常用样本均值去估计总体平均数;
(2)总体平均数是一个确定的数,样本平均数具有随机性(应为样本具有随机性);
(3)一般情况下,样本量越大,估计越准确.
3、分层随机抽样
(1)分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(2)分层随机抽样的平均数计算
在分层随机抽样中,以层数是2为例,如果第1层和第2层包含的个体数分别为和,抽取的样本量分别为和,第1层和第2层的样本平均数分别为,,样本平均数位,则.我们可以采用样本平均数估计总体平均数
【即时演练】(40%)
1. 某班有50名学生,按男、女生分层随机抽样,从男、女生中各取样6人和9人,则这个班男生人数是班级总人数的 .
2. 从某班57名同学中选出4人参加户外活动,利用随机数表法抽取样本时,先将57名同学按01、02、…、57进行编号,然后从随机数表第一行的第7列和第8列数字开始往右依次选取两个数字,则选出的第4个同学的编号为( )(注:下表中的数据为随机数表第一行和第二行)
0347
4373
8636
9647
3661
4698
6371
6297
7424
6292
4281
1457
2042
5332
3732
1676
A.24 B.36 C.42 D.52
3. 某工厂生产三种不同型号的产品,它们的产量之比为,用分层抽样的方法抽取一个容量为的样本.若样本中型号的产品有120件,则样本容量为( )
分层
样本量
样本平均数
第一层
10
55
第二层
30
75
第三层
10
90
A.150 B.180 C.200 D.250
4. 已知总体划分为3层,按比例用分层随机抽样法抽样,各层的样本量及样本平均数如下表:
估计总体平均数为( )
A.73 B.74
C.76 D.80
5. 将某学校一次物理测试学生的成绩统计如下图所示,则估计本次物理测试学生成绩的平均分为(同一组数据用该组区间的中点值作代表)( )
A.68 B.70
C.72 D.74
6. 有以下两个案例:
案例一:从同一批次同类型号的10袋牛奶中抽取3袋分别检测三聚氰胺的含量;
案例二:某公司有员工800人,其中具有高级职称的有160人,具有中级职称的有320人,具有初级职称的有200人,其他人员120人,从中抽取容量为40的样本,了解他们的收入情况.
(1)你认为这两个案例分别应采用怎样的抽样方式较为合适?
(2)在你使用的分层抽样案例中写出抽样过程.
4、统计图表
(1)常见的统计图表有条形图、扇形图、折线图、频数分布直方图、频率分布直方图等.
(2)频率分布表、频率分布直方图的制作步骤及意义
(3)绘制频率分布直方图的步骤及频率分布直方图的性质
①求极差,即一组数据中的最大值与最小值的差.
②决定组距与组数.组距与组数的确定没有固定的标准,一般数据的个数越多,所分组数越多.当样本容量不超过100时,常分成5~12组.为方便起见,一般取等长组距,并且组距应力求“取整”.
③将数据分组.
④列频率分布表.计算各小组的频率,第组的频率是.
⑤画频率分布直方图.其中横轴表示分组,纵轴表示.实际上就是频率分布直方图中各小长方形的高度,它反映了各组样本观测数据的疏密程度.
5、总体百分位数的估计
(1)第百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(2)计算一组个数据的第百分位数的步骤:
第1步,按从小到大排列原始数据.
第2步,计算.
第3步,若不是整数,而大于的比邻整数为,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
6、样本的数字特征
(1)众数 一组数据中出现次数最多的数据(即频率分布最大的样本数据)称为这组数据的众数.
(2)中位数:一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
(3)平均数:一组数据的和与这组数据的个数的商称为这组数据的平均数.数据,,,的平均数为
(4)标准差与方差:如果有个数据,,,那么平均数,
标准差为:,方差:
7、在频率分布直方图中,众数,中位数,平均数的估计值
(1)最高的小矩形底边中点的横坐标即是众数;
(2)中位数左边和右边的所有小矩形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘小矩形底边中点的横坐标之和.
【即时演练】(60%)
1. 样本数据的极差和第75百分位数分别为 、 .
2. 已知一组样本数据的样本平均数为3,方差为2,由生成一组新的样本数据,则新数据的平均数为 ;样本方差为 .
3. 在对树人中学高一年级学生身高的调查中,采用样本比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生20人,其平均数和方差分别为170和10,抽取了女生30人,其平均数和方差分别为160和15.则估计出总样本的方差为 .
4. 某校为了解今年春季学期开学第一周,高二年级学生参加学校社团活动的时长,有关部门随机抽查了该校高二年级100名同学,统计他们今年春季学期开学第一周参加学校社团活动的时长,并绘制成如图所示的频率分布直方图.其中这100名同学今年春季学期开学第一周参加学校社团活动的时长(单位:小时)范围是,数据分组为.这100名同学中,今年春季学期开学第一周参加学校社团活动的时长不少于6小时的人数为 人.
5. 已知退休的王大爷连续天户外运动的步数(单位:百步)分别为,,,,,则该组数据的均值与方差分别为( )
A., B., C., D.,
6. 有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
设甲、乙两名运动员射击平均环数分别记为和,方差分别记为和.
(1)求,,,;
(2)如果你是教练,你如何对这次射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择?
四、综合检验(70%,建议倒序)
1. 一数学学习小组有5名同学,他们的历次数学考试成绩都比较稳定,且每次测试5人成绩的方差均为6左右.某次数学测试他们中的甲同学因故没能参加考试,其余四位同学的数学成绩分别为111分,114分,117分,118分.如果甲同学参加这次考试,利用以往的经验(方差为6)估计其成绩为( )
A.112分 B.113分 C.115分 D.119分
2. 高二年级进行消防知识竞赛,统计所有参赛同学的成绩,成绩都在内,估计所有参赛同学成绩的第25百分位数为( )
A. B.70
C.72 D.75
3. 在践行“乡村振兴”战略的过程中,某地大力发展特色花卉种植业.某农户种植一种观赏花㚏,为了解花卉的长势,随机测量了枝花的高度(单位:),得到花枝高度的频率分布直方图,如图所示,则( )
A.样本花卉高度的极差不超过
B.样本花卉高度的中位数不小于众数
C.样本花的高度的平均数不小于中位数
D.样本花升高度小于的占比不超过
4. 已知一组数据的平均数,方差,则数据的平均数、方差分别为( ) A.16,20 B.16,80 C.18,20 D.18,80
5. 在2024年巴黎奥运会上,中国跳水队表现卓越,成功包揽了全部8枚跳水金牌,这一成绩不仅创造了历史,也再次证明了“梦之队”的实力和统治力.跳水比赛计分规则如下:针对运动员每次跳水,共有7个裁判评分,去掉一个最高分与一个最低分,剩下的分数相加后乘以难度分,即可得出最终得分.下列说法正确的是( )
A.去掉一个最高分与一个最低分前后,两组数据的中位数一定改变
B.去掉一个最高分与一个最低分前后,两组数据的方差可能不变
C.去掉一个最高分与一个最低分前后,两组数据的平均数不变
D.去掉一个最高分与一个最低分前后,两组数据的众数不变
6. (多选)某高中举行的纪念红军长征出发90周年的知识答题比赛,对参赛的2000名考生的成绩进行统计,可得到如图所示的频率分布直方图,若同一组中数据用该组区间中间值作为代表值,则下列说法中正确的是( )
A.参赛成绩的众数约为75分
B.用分层抽样从该校学生中抽取容量为200的样本,则应在内的成绩抽取30人
C.参赛成绩的第75百分位数约为82.5分 D.参赛成绩的平均分约为72.8分
五、课后作业(80%)
1. 已知x、x+1、x+3、x+5、x+6的平均数为5,则它们的中位数为( )
A.3 B.4 C.5 D.6
2. 某校组织50名学生参加庆祝中华人民共和国成立75周年知识竞赛,经统计这50名学生的成绩都在区间内,按分数分成5组:,得到如图所示的频率分布直方图(不完整),根据图中数据,下列结论错误的是( )
A.成绩在上的人数最少
B.成绩不低于80分的学生所占比例为
C.50名学生成绩的极差为50
D.50名学生成绩的平均分小于中位数
3. 高二年级进行消防知识竞赛,统计所有参赛同学的成绩,成绩都在内,估计所有参赛同学成绩的第75百分位数为( ) A. B. C. D.
4. 某学校的高一、高二及高三年级分别有学生人、人、人,用分层抽样的方法从全体学生中抽取一个容量为人的样本,抽出的高一、高二及高三年级学生的平均身高为、、,估计该校学生的平均身高是( )
A. B. C. D.
5. (多选)现有一组各不相同且从小到大排列的样本数据,下列说法正确的是( )
A.的下四分位数为 B.的中位数为
C.的平均数小于的平均数
D.的方差是的方差的4倍.
6. 新冠肺炎疫情在我国爆发以来,我国举国上下众志成城、团结一致抗击新冠肺炎疫情,经过几个月的努力,我国的疫情已经得到有效控制.为了解大众对新冠肺炎相关知识的掌握情况,某网站举行“新冠肺炎”防控知识竞赛网上答题,共有人通过该网站参加了这次竞赛,为了解竞赛成绩情况,从中随机抽取了名学生的成绩,绘制成如图所示的频率分布直方图;
(1)试估计这名学生成绩的第百分位数;
(2)若采用分层抽样的方法从成绩在,,的学生中共抽取人参加志愿者活动.现从这人中随机抽取人分享活动经验,求抽取的人成绩都在的概率.
六、巩固复习第一轮(85%)
1. 某公司有1500名员工,其中男员工800名,女员工700名.为了解该公司员工的身体状况,现按性别进行分层抽样,从全体员工中抽取30名进行调查,则应抽取男员工的人数为( )
A.14 B.15 C.16 D.17
2. 某数学兴趣小组20名成员在规定时间内独立解答6个数学问题,最终结果如下:有1人解出1个问题,有1人解出2个问题,有4人解出3个问题,有4人解出4个问题,有5人解出5个问题,有5人解出6个问题,则解出问题个数的第三四分位数为( )
A.3 B.4.5 C.5 D.5.5
3. 二十大报告明确指出,人民健康是民族昌盛和国家强盛的重要标志.青少年处于健康生长的关键时期,其身高和体重是反映他们生长发育和营养状况的基本指标.某校从高一年级随机抽取了20名女生,得到她们的身高数据如下(单位:):则这组数据的第一四分位数( )
.
A.155 B.155.5 C.156 D.156.5
4. 某市政府计划对居民生活用水实施阶梯式水价制度,即确定一户居民月均用水量标准(单位:),用水量不超过的部分按平价收费,超出的部分按议价收费,该市随机调查了10000户居民,获得了他们的月均用水量数据,整理得到频率分布直方图(如图).如果要让该市的居民用户的月均用水量不超出标准,那么应为 (单位:).
5. 为了调查学生在一学期内参加物理实验的情况,从某校随机抽取100名学生,经统计得到他们参加物理实验的次数均在区间内,其数据分组依次为:,,,,.若.
(1)求这100名学生中,物理实验次数在内的人数;
(2)估计该校学生在一学期内参加物理实验的次数在15次到20次之间的概率.
七、巩固复习第二轮(90%)
1. 某小组六名学生上周的体育运动时间为、、、、、,则该小组体育运动时间的平均数和方差是( )
A.、 B.、 C.、 D.、
2. (多选)某校为调查学生身高情况,按男女生比例进行分层随机抽样,抽取一个容量为50的样本.已知中男生数据为23个,平均数为,方差为12.59;女生数据为27,平均数为,方差为38.62.下列说法正确的是( )
A.该校男生的身高都比女生高 B.该校女生身高分布比男生集中
C.样本的平均数为 D.样本的方差为51.4862
3. 若,则下列不等式①;②;③;④中,正确的不等式有( ) A.1个 B.2个 C.3个 D.4个
4. 若,则下列结论正确的是( )
A. B. C. D.
5. 设,,函数.
(1)求不等式的解集;
(2)若在上的最大值为,求的取值范围.
八、错题回顾(95%)
页码+题号:
九、巩固复习第三轮(100%)
1. 下列各组函数表示同一函数的是( )
A.和 B.和
C.和 D.与
2. 对于温度的计量,世界上大部分国家使用摄氏温标(),少数国家使用华氏温标(),两种温标间有如下对应关系:
摄氏温标()
…
0
10
20
30
40
50
…
华氏温标()
…
32
50
68
86
104
122
…
根据表格中数值间呈现的规律,给出下列三个推断: ①对应; ②对应;
③存在某个温度,其摄氏温标的数值等于其华氏温标的数值.
其中所有正确推断的序号是 .
3. 已知函数则 ;方程的解为 .
4. 若二次函数的图象的对称轴为,最小值为,且.
(1)求的解析式;
(2)若关于x的不等式在区间上恒成立,求实数m的取值范围.
5. 从甲乙两个班的男生中各随机抽取10名同学, 测量他们的身高(单位:cm),获得身高数据的茎叶图如图所示.求样本中:
(1)甲班的中位数和乙班的众数以及甲、乙两个班的平均身高;
(2)甲班的样本方差.
【课后作业答案】1C 2C 3B 4B 5BCD 6 (1) (2) 0.2
学科网(北京)股份有限公司
$$