内容正文:
第28章 统计初步
教学目标
1. 学习数据描述的方法;统计图的选择;
2. 知道统计的意义;学会用样本估计总体;
3. 会求平均数,加权平均数,截尾平均数;
4. 了解中位数与众数的统计意义;会求方差与标准差;学会用它们做决策;
5. 掌握频数分布直方图;频率分布直方图及其应用。
教学重难点
1.重点
(1)统计图;
(2)表示一组数据平均水平的量;表示一组数据波动程度平的量;
(3)表示一组数据分布量。
2.难点
(1)平均数、中位数、众数等含参数问题;
(2)统计初步的综合应用。
知识点1 数据整理与表示 统计的意义
一、数据的描述
描述数据的方法有两种:统计表和统计图.
统计表:利用表格将要统计的数据填入相应的表格内,表格统计法可以很好地整理数据
统计图:利用“条形图”、“扇形图”、“折线图”描述数据,这样做的最大优点是将表格中的数据所呈现出来的信息直观化.
要点:
(1)条形统计图:用线段长度表示数据,根据数据的多少画成长短不同的长方形直条,然后按顺序把这些直条排列起来,条形统计图很容易看出数据的大小,便于比较,但不能清楚地反映各部分占总体的百分比.
(2)扇形统计图:用整个圆表示总体,用圆内各个扇形的大小表示各部分数量,从扇形上可清楚地看出各部分量和总数量之间的关系,但不能直接表示出各个项目的具体数据.
(3)折线统计图:用一个单位长度表示一定的数量,根据数量的多少描出各点,然后把各点用线段依次连接起来,折线图不但可以表示出数量的多少,而且能够清楚地表示出数量的增减变化情况,但不能清楚地反映数据的分布情况.
二、统计图的选择
统计图:利用“条形图”、“扇形图”、“折线图”描述数据,这样做的最大优点是将表格中的数据所呈现出来的信息直观化.
要点:
(1)条形统计图:用线段长度表示数据,根据数据的多少画成长短不同的长方形直条,然后按顺序把这些直条排列起来,条形统计图很容易看出数据的大小,便于比较,但不能清楚地反映各部分占总体的百分比.
(2)扇形统计图:用整个圆表示总体,用圆内各个扇形的大小表示各部分数量,从扇形上可清楚地看出各部分量和总数量之间的关系,但不能直接表示出各个项目的具体数据.
(3)折线统计图:用一个单位长度表示一定的数量,根据数量的多少描出各点,然后把各点用线段依次连接起来,折线图不但可以表示出数量的多少,而且能够清楚地表示出数量的增减变化情况,但不能清楚地反映数据的分布情况.
三、统计的意义
1.统计学相关概念
总体:调查时,调查对象的全体叫做总体.
个体:组成总体的每一个调查对象叫做个体.
样本:从总体中取出的一部分个体叫做总体的一个样本.
样本容量:样本中个体的数量叫做样本容量(不带单位).
要点:
(1)“调查对象的全体”一般是指调查对象的某种数量指标的全体,如对于一个班级,如果考察的是这个班学生的身高,那么总体是指这个班学生身高的全体,不能错误地理解为学生的全体是总体.
(2)样本是总体的一部分,一个总体中可以有许多样本,样本在一定程度上能够反映总体,为了使样本能较好地反映总体情况,在选取样本时要注意使其具有一定的代表性.
(3) 样本容量是一个数字,不能有单位.一般地,样本容量越大,通过样本对总体的估计越精确,在实际研究中,要根据具体情况确定样本容量的大小.例如:“从5万名考生的数学成绩中抽取2000名考生的数学成绩进行分析”,样本是“2000名考生的数学成绩”,而样本容量是“2000”,不能将其误解为“2000名考生”或“2000名”.
2. 调查的方法:普查和抽样调查
(1)普查:考察全体对象的调查叫做普查.
要点:
(1)普查又叫“普查”,它是指在统计的过程中,为了某种特定的目的而对所有考察的对象一一作出的调查,在记录数据时,通常用划记法进行记录数据.
(2)一般来说,普查能够得到全体被调查对象的全面、准确的信息,但有时总体中的个体的数目非常大,普查的工作量太大;有时受条件的限制,无法进行普查;有时调查具有破坏性(例如:测试一批灯泡的使用寿命或炮弹的杀伤半径等),不能进行普查.
(2)抽样调查:从调查对象中抽取部分对象进行调查,然后根据调查的数据推断全体对象的情况,这种调查方式称为抽样调查.
要点:
(1)从总体中抽取部分个体进行调查的方式,我们称抽样调查,在抽取的过程中,总体中的每一个个体都有相等的机会被抽到,像这样的抽样方式是一种简单随机抽样.
(2)抽样调查方便、快捷,能够减少调查统计的工作量但调查的结果不如“普查”得到的结果准确.
(3)调查方法的选择:
①普查是对考查对象的全体调查,它要求对考查范围内所有个体进行一个不漏的逐个准确统计;而抽样调查则只是对总体中的部分个体进行调查,以样本来估计总体的情况.
②在调查实际生活中的相关问题时,要灵活处理,既要考虑问题本身的需要,又要考虑实现的可能性和所付出代价的大小.
3. 随机样本
具有代表性的样本叫作随机样本。
4. 用样本估计总体
比如在保护区内不同的地方,将20只黑叶猴背上涂一个色块做标记,再放归野外,一个月后如果在保护区内不同的地方观察到60只黑叶猴,发现其中2只黑叶猴有记号,那么我们就能粗略估计该自然保护区里黑叶猴的数量,这里假定有记号的黑叶猴在自然保护区里是均匀分布的,观察到的黑叶猴又是随机的,因此60只黑叶猴中出现有记号的黑叶猴数与60的比,应该与保护区所有黑叶猴中存在20只有记号的黑叶猴数与黑叶猴总数的比大致相同.
经计算,自然保护区里大约有600只黑叶猴.
【即学即练】
1.下列调查中,适宜采用抽样调查的是( )
A.调查冬奥会高山滑雪运动员兴奋剂的使用情况
B.调查某批次汽车的抗撞击能力
C.神舟二十一号载人飞船发射前对零部件的检查
D.调查全班观看电影《哪吒2》的情况
【答案】B
【分析】本题考查了调查统计的知识;解题的关键是熟练掌握抽样调查和全面调查的性质.
抽样调查适用于总体较大、全面调查困难或具有破坏性的场景.选项B中汽车抗撞击测试具有破坏性,需抽样调查;其他选项均需全面调查.
【详解】A:兴奋剂检查需全面调查,以确保竞赛公平;
B:汽车抗撞击测试为破坏性测试,不宜全面调查,宜抽样;
C:航天器零部件检查需全面确保安全;
D:全班人数少,易全面调查.
故选:B.
2.要制作空气中各成分所占百分比,选取的统计图是( )
A.条形统计图 B.折线统计图
C.扇形统计图 D.三种都可以
【答案】C
【分析】此题考查了统计图的选择,解答此题要熟练掌握统计图的特点,根据实际情况灵活选择.条形统计图能很容易看出数量的多少;折线统计图不仅容易看出数量的多少,而且能反映数量的增减变化情况;扇形统计图能反映部分与整体的关系.
根据统计图的特点选择即可.
【详解】解:要制作空气中各成分所占百分比,选取的统计图应是扇形统计图.
故选:C.
3.为了解某校七年级名学生参加社团的情况,小郑随机抽取部分学生进行调查统计,并绘制如图所示的扇形统计图,那么下列说法不正确的是( )
A.参加编程的学生有人
B.参加摄影所在扇形的圆心角度数为
C.参加编程的人数是参加合唱人数的2倍
D.参加其他社团的人数占总人数的10%
【答案】B
【分析】此题考查了扇形统计图,理解题意,读懂统计图并从统计图中提取相关的解题信息是解答此题的关键.
根据扇形统计图中各部分所占比例,对每个选项进行分析判断.
【详解】解:A.已知编程社团占比,总人数为,那么参加编程的学生人数为,该选项正确,不符合题意;
B.摄影社团占比,整个圆的圆心角是,所以参加摄影所在扇形的圆心角度数为,该选项错误,符合题意;
C.编程社团占比,合唱社团占比,,所以参加编程的人数是参加合唱人数的倍,该选项正确,不符合题意;
D.把总人数看作单位“”,参加其他社团的人数占总人数的比例为,该选项正确,不符合题意;
故选:B.
4.甲、乙两家超市1~8月的月利润情况如图所示,下列说法中,不正确的是( )
A.甲超市的月利润逐月减少 B.4~8月乙超市的月利润逐月减少
C.3月甲、乙两家超市的月利润相等 D.6月甲、乙两家超市的月利润相差最大
【答案】D
【分析】本题考查了折线统计图基础及其应用,由折线统计图,分别得出甲、乙两家超市1~8月的月利润,据此判断每个选项的结论正确与否,选出结论错误的选项即可.
【详解】解:由折线统计图中甲超市1~8月的月利润的变化趋势,可以看出甲超市的月利润逐月减少,故选项A的结论正确.同理可得选项B的结论正确.因为甲、乙两家超市1~8月的月利润情况的折线统计图在3月处交于一点,所以3月甲、乙两家超市的月利润相等.故选项C的结论正确.由折线统计图,分别得出甲、乙两家超市1~8月的月利润,可得1月甲、乙两家超市的月利润相差最大,故选项D的结论错误.
故选:D.
知识点2 表示一组数据平均水平的量
一、平均数和加权平均数
一般地,对于个数,我们把叫做这个数的平均数,记作.计算公式为.
要点:
平均数表示一组数据的“平均水平”,反映了一组数据的集中趋势.
(1)当一组数据较大时,并且这些数据都在某一常数附近上、下波动时,一般选用简化计算公式.其中为新数据的平均数,为取定的接近这组数据的平均数的较“整”的数.
(2)平均数的大小与一组数据里的每个数据均有关系,其中任一数据的变动都会相应引起平均数的变动.所以平均数容易受到个别特殊值的影响.
若个数的权分别是,则叫做这个数的加权平均数.
要点:
(1)相同数据的个数叫做权,越大,表示的个数越多,“权”就越重. 数据的权能够反映数据的相对“重要程度”.
(2)加权平均数实际上是算术平均数的另一种表现形式,是平均数的简便运算.
二、样本平均数与总体平均数
我们把样本年琬有个体的平均数称为样本平均数;把总体中所有个体的平均数称为总体平均数随机样本的容量越大,样本平均数就越接近于总体平均数必要时,可以用样本平均数来估计总体平均数.
三、截尾平均数
截尾平均数:去掉一个最大值,去掉一个最小值,剩下的数求平均数。
四、中位数和众数
1.中位数的概念:将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数称为这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数称为这组数据的中位数.
要点:(1)一组数据的中位数是唯一的;一组数据的中位数不一定出现在这组数据中.
(2)由一组数据的中位数可以知道中位数以上和以下数据各占一半.
2.众数的概念:一组数据中出现次数最多的数据称为这组数据的众数.
要点:(1)一组数据的众数一定出现在这组数据中;一组数据的众数可能不止一个;如果所有数据出现的次数都一样,那么这组数据就没有众数.
(2)众数是一组数据中出现次数最多的数据而不是数据出现的次数.
五、平均数、中位数与众数的联系与区别
联系:平均数、众数、中位数都是用来描述数据集中趋势的量,其中以平均数最为重要.
区别:平均数的大小与每一个数据都有关,任何一个数的波动都会引起平均数的波动,当一组数据中有个别数据太高或太低,用平均数来描述整体趋势则不合适,用中位数或众数则较合适.中位数与数据排列位置有关,个别数据的波动对中位数没影响;众数主要研究各数据出现的频数,当一组数据中不少数据多次重复出现时,可用众数来描述.
【即学即练】
1.有一组数据:6,4,6,5,3,则这组数据的平均数、众数、中位数分别是( )
A.5,6,5 B.5,5,5 C.,6,6 D.,6,5
【答案】D
【分析】本题考查平均数、众数和中位数,熟练掌握平均数、众数和中位数的定义是解题的关键,根据定义直接计算即可.
【详解】解:∵ 将数据从小到大排列为:3,4,5,6,6
∴ 平均数,
∵ 6出现2次,其余数各出现1次,
∴ 众数为:6,
∴ 中位数为第3个数,即为:5,
故选:D.
2.一名射击运动员连续射靶8次,命中的环数如下:8,9,10,9,7,8,10,8.这名运动员射击环数的众数与中位数分别是( )
A.9环与8环 B.8环与8.5环 C.8.5环与9环 D.8环与8环
【答案】B
【分析】本题考查众数和中位数,根据众数是一组数据中出现次数最多的数据,中位数是将数据排序后位于中间的一位数据或中间两位的平均数,进行求解即可.
【详解】解:出现次数最多的数据为8,排序后处于中间的位2个数据为8和9,
故众数为8环,中位数为环;
故选B.
3.为建设生态城市,某中学在植树节那天,组织九年级八个班的学生到西城新区植树,各班植树情况如下表:
班级
一
二
三
四
五
六
七
八
合计
棵数
15
18
22
25
29
14
18
19
160
这组数据的中位数、众数分别是( )
A.18,18 B.18.5,18 C.19,19 D.19.5,19
【答案】B
【分析】本题考查中位数和众数的计算,中位数需将数据排序后取中间值(偶数个时取中间两数的平均值),众数为出现次数最多的数.
【详解】解:将数据从小到大排序:14, 15, 18, 18, 19, 22, 25, 29,
∵数据个数,为偶数,
∴中位数=(第4个数+第5个数)÷ 2 =,
∵18出现2次,其他数均出现1次,
∴众数为18,
综上所述,中位数为18.5,众数为18.
故选:B.
知识点3 表示一组数据波动程度的量
一、*极差、方差和标准差
用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围,用这种方法得到的差称为*极差,*极差=最大值-最小值.
要点:极差是最简单的一种度量数据波动情况的量,它受极端值的影响较大.一组数据极差越小,这组数据就越稳定.
方差是反映一组数据的整体波动大小的特征的量.方差的计算公式是:
要点:(1)方差反映的是一组数据偏离平均值的情况.方差越大,数据的波动越大;方差越小,数据的波动越小.
(2)一组数据的每一个数都加上(或减去)同一个常数,所得的一组新数据的方差不变.
(3)一组数据的每一个数据都变为原来的倍,则所得的一组新数据的方差变为原来的倍.
方差的算术平方根叫做这组数据的标准差,用符号表示,即:
;标准差的数量单位与原数据一致.
二、*极差、方差和标准差的联系与区别
联系:*极差与方差、标准差都是表示一组数据离散程度的特征数.
区别:*极差表示一组数据波动范围的大小,它受极端数据的影响较大;方差反映了一组数据与其平均值的离散程度的大小.方差越大,稳定性也越小;反之,则稳定性越好.所以一般情况下只求一组数据的波动范围时用极差,在考虑到这组数据的稳定性时用方差.
三、用样本估计总体
在考察总体的平均水平或方差时,往往都是通过抽取样本,用样本的平均水平或方差近似估计得到总体的平均水平或方差.
要点:(1)如果总体数量太多,或者从总体中抽取个体的试验带有破坏性,都应该抽取样本.取样必须具有尽可能大的代表性.
(2) 用样本估计总体时,样本容量越大,样本对总体的估计也越精确.样本容量的确定既要考虑问题本身的需要,又要考虑实现的可能性所付出的代价.
【即学即练】
1.某小组位学生一次数学测试的分数为,,,,,,,,那么这个小组测试分数的标准差是 .
【答案】
【分析】先计算出这组数据的平均数,再依据方差的计算公式求出数据的方差,继而取方差的算术平方根即可.
【详解】解:这组数据的平均数为,
所以这个小组测试分数的方差是,
则这个小组测试分数的标准差是,
故答案为:.
2.在一场物理实验探究中,甲、乙、丙、丁四名同学分别对同一测量仪器进行10次测量操作,他们测量的平均值相同,测量数据的方差分别是,,,,则这四名同学中测量成绩最稳定的是( )
A.甲 B.乙 C.丙 D.丁
【答案】B
【分析】本题考查了利用方差判断稳定性.方差是衡量数据波动程度的统计量,方差越小,表示数据越稳定,比较甲、乙、丙、丁四人的方差值,乙的方差最小,因此测量成绩最稳定,据此进行分析,即可作答.
【详解】解:∵,,,,且,
∴乙的测量成绩最稳定,
故选:B
3.甲、乙两地4月下旬的日平均气温统计图如图所示,那么由图中信息可知甲、乙两地这10天日平均气温比较稳定的是 .(填“甲”或“乙”)
【答案】乙
【分析】由方差的意义知,波动小者方差小,根据气温统计图可知:乙地的平均气温比较稳定,波动小.从而可得答案.
【详解】解:观察平均气温统计图可知:乙地的平均气温比较稳定,波动小;故乙地的日平均气温的方差小.
故答案为:乙.
【点睛】本题考查方差的意义:方差反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.
4.小莹在计算一组数据的方差时,列出没有化简的算式:关于这组数据,下列说法正确的是( )
①平均数是;②众数是;③中位数是;④样本容量是.
A.①② B.③④ C.①③ D.②④
【答案】A
【分析】本题考查方差的定义,熟练掌握平均数与方差的定义是解题的关键.
根据方差算式可知数据为2、4、5、5,据此计算平均数、众数、中位数和样本容量即可.
【详解】解:由于方差算式中有四个平方项,分母为4,
则数据点为5、2、5、4,即数据为2、4、5、5,样本容量为4,则④错误;
根据数据之和为,个数为4,平均数,则①正确;
在这组数据中5出现次数最多,则众数为5,②正确;
将数据排序后为2、4、5、5,则中位数为,故③错误;
综上,正确的有①②.
故选:A.
5.已知一组数据的平均数是2,方差是,那么另一组数据的平均数是 ,方差是 .
【答案】 4 3
【分析】本题主要考查了平均数,方差,根据平均数,方差公式计算即可.
【详解】一组数据的平均数为,
方差,
∴另一组数据的平均数为,
方差为
.
故答案为:4,3.
知识点4 表示一组数据分布的量
一、组距、频数、频率与频数分布表
1.组距:把所有数据分成若干组,每个小组的两个端点之间的距离(组内数据的取值范围).
2. 频数:在统计数据时,某个对象出现的次数或落在某个组别中的数据的个数称为频数.
3. 频率:频数与总次数的比值称为频率.
4.频数分布表:把各个组别中相应的频数分布用表格的形式表示出来,所得表格就是频数分布表.
频数分布表能清楚地反映一组数据的大小分布情况.将一批数据分组,一般数据越多,分的组也越多.当数据在100个以内时,按照数据的多少,常分成5~12组.在分组时,要灵活确定组距,使所分组数合适,一般组数为的整数部分+1.
要点:
(1)频数之和等于样本容量,各频率之和等于1;
(2)制作频数分布表的一般步骤:①计算最大值与最小值的差;②决定组距和组数;③确定分点;④列频数分布表.
二、频数分布直方图
1.频数分布直方图
根据频数分布表,用横轴表示各分组数据、纵轴表示各组数据的频数,绘制条形统计图.这样的条形统计图,直观地呈现了频数的分布特征和变化规律,称为频数分布直方图.
2.画频数分布直方图的步骤
(1)计算最大值与最小值的差;
(2)决定组距与组数;
(3)列频数分布表;
(4)画频数分布直方图.
3. 频数分布直方图与条形图的联系与区别
(1)联系:它们都是用矩形来表示数据分布情况的;当矩形的宽度相等时,都是用矩形的高来表示数据分布情况的;频数分布直方图是特殊的条形统计图.
(2)区别:①由于分组数据具有连续性,频数分布直方图中各“条形”之间通常是连续排列,中间没有间隙,而条形图中各“条形”是分开排列的,中间有一定的间隙;②条形统计图用横向指标表示考察对象的类别,用纵向指标表示不同对象的数量. 频数分布直方图横向指标表示考察对象数据的变化范围,用纵向指标表示相应范围内数据的频数.
要点:
(1)频数分布直方图简称直方图,它是条形统计图的一种.
(2)注意直方图与条形图、扇形图、折线图在表示数据方面的优缺点.
三、频率分布直方图:通常在频率分布直方图中,用每小组对应的小矩形的面积表示该小组的组频率.因此在频率分布直方图中,纵轴表示频率与组距的商,即,横轴的意义与频数分布直方图相同。
【即学即练】
1.已知一个50个数据的样本,把它分成6组,第一组到第四组的频数分别是8、6、11、7,第五组的频率是,那么第六组的频数是 .
【答案】8
【分析】本题主要考查了对频率、频数灵活运用,注意:各小组频数之和等于数据总和,各小组频率之和等于1,比较简单.首先根据频率频数总数,计算从第一组到第四组的频率之和,再进一步根据一组数据中,各组的频率和是1,进行计算.
【详解】解:根据题意得:第一组到第四组的频率和是:
,
又∵第五组的频率是,
∴第六组的频率为,
∴第六组的频数为:.
故答案为:8.
2.一组数共有80个,最大值是136,最小值是52,用频数分布直方图描述这一数据,取组距为10,则可以分成 组.
【答案】9
【分析】求出最大值和最小值的差,然后除以组距,用进一法取整数值就是组数.
【详解】解:136-52=84,
84÷10=8.4,
所以应该分成9组,
故答案为:9.
【点睛】本题考查频率分布表中组数的确定,关键是求出最大值和最小值的差,然后除以组距,用进一法取整数值就是组数.
3.某学校对部分学生的睡眠时间进行调查统计,得到的频数分布直方图(每组含前一个边界值,不含后一个边界值)如图所示,其中睡眠时间在小时的学生所占百分比为,则睡眠时间在小时的学生有 人.
【答案】
【分析】本题考查了频数分布直方图,由睡眠时间在小时的学生人数及百分比求出调查的学生人数,进而求出睡眠时间在小时的学生人数,即可求解,看懂频数分布直方图是解题的关键.
【详解】解:由题意可得,调查的学生人数为(人),
∴睡眠时间在小时的学生人数为(人),
∴睡眠时间在小时的学生有(人),
故答案为:.
4.某区有1200名学生参加了“垃圾分类"知识竞赛,为了解本次竞赛成绩分布情况,竞赛组委会从中随机抽取部分学生的成绩(得分都是整数)作为样本,绘制成频率分布直方图(如图) .请根据提供的信息估计该区本次竞赛成绩在89.5分~ 99.5分的学生有 名.
【答案】180
【分析】根据,计算求出成绩在89.5分~ 99.5分的学生的频率,然后乘以计算求解即可.
【详解】解:由频率分布直方图可知,成绩在89.5分~ 99.5分的学生频率为,
∴估计该区本次竞赛成绩在89.5分~ 99.5分的学生有(名),
故答案为:180.
【点睛】本题考查了频率分布直方图,用样本估计总体.根据频率分布直方图求出频率是解题的关键.
题型01 统计的意义
【典例1】.下列调查中,适宜采用普查方式的是( )
A.调查一批新型节能灯泡的使用寿命
B.调查上海市中小学生的课外阅读时间
C.全市中学生对《流浪地球》影评
D.对我国六代战斗机“歼﹣36”试飞前整机零部件质量的调查
【答案】D
【分析】本题考查全面调查与抽样调查的适用情况,理解全面调查与抽样调查的适用性是解决问题的关键.全面调查适用于对象数量少、结果要求精确或不可破坏性检查的情况;抽样调查适用于具有破坏性、无法普查、普查意义或价值不大的情况,根据全面调查与抽样调查的适用性,结合选项逐项分析即可得到答案.
【详解】解:A、调查一批新型节能灯泡的使用寿命,具有破坏性,需抽样调查避免全部损毁,适宜采用抽样调查,不符合题意;
B、调查上海市中小学生的课外阅读时间,需在多个年级段抽样,样本基数比较大,无法全面覆盖,适宜采用抽样调查,不符合题意;
C、全市中学生对《流浪地球》影评,样本基数比较大,无法全面覆盖,适宜采用抽样调查,不符合题意;
D、对我国六代战斗机“歼﹣36”试飞前整机零部件质量的调查,必须确保绝对安全,需逐一检查,故需全面调查,符合题意;
故选:D.
【变式1】.为了解某校学生的睡眠时间,下列抽样调查中样本具有代表性的是( )
A.选择九年级一个班的学生进行调查;
B.选择全校的男生进行调查;
C.对全校成绩排名前的学生进行调查;
D.每个班级随机抽取的学生进行调查.
【答案】D
【详解】本题考查的是样本的特点,抽样调查的样本需具有代表性和随机性,应覆盖总体中的不同群体,避免偏差,根据样本特点逐一分析即可.
【分析】解:选项A:仅选取九年级一个班,样本范围过小且局限于特定年级,无法反映全校情况.
选项B:仅调查男生,忽略女生,存在性别偏差,样本不全面.
选项C:选择成绩前的学生,此类学生作息可能异于其他学生,导致结果偏差.
选项D:每个班级随机抽取,既保证各班级均有覆盖,又通过随机性减少人为干扰,样本分布均匀,最具代表性.
故选:D
【变式2】.某校为了了解学生对“二十四节气”的知晓情况,从全校6000名学生中,随机抽取了120名学生进行调查,在这次调查中( )
A.6000名学生是总体
B.所抽取的120名学生是总体的一个样本
C.6000名是样本容量
D.所抽取的120名学生对“二十四节气”的知晓情况是总体的一个样本
【答案】D
【分析】本题考查了总体、个体、样本、样本容量的概念.首先找出考查的对象,从而找出总体、个体.再根据被收集数据的这一部分对象找出样本,最后再根据样本确定出样本容量.
【详解】解:A、6000名学生对“二十四节气”的知晓情况是总体,此选项说法错误,不符合题意;
B、所抽取的120名学生对“二十四节气”的知晓情况是总体的一个样本,此选项说法错误,不符合题意;
C、样本容量是120,此选项说法错误,不符合题意;
D、所抽取的120名学生对“二十四节气”的知晓情况是总体的一个样本,此选项说法正确,符合题意;
故选:D.
题型02 求平均数、中位数、众数、方差、标准差
【典例1】.一组数据:3,4,4,6,8.这组数据的平均数是()
A.3 B.4 C.5 D.6
【答案】C
【分析】本题主要考查了平均数,掌握平均数的求法是解题的关键.
计算一组数据的平均数,只需将所有数据相加后除以数据的个数即可.
【详解】∵数据总和为,数据个数为5,
∴平均数为.
故选:C.
【变式1】.一组数据:,,,,,,,这组数据的众数和中位数分别是( ).
A., B., C., D.,
【答案】D
【分析】本题主要考查众数和中位数的定义,熟练掌握众数和中位数的定义是解题关键.根据众数是出现次数最多的数据,中位数是将数据排序后位于中间的数据即可求得.
【详解】解:将数据按照从小到大排列为: ,,,,,,,
∴数据出现次,数据出现次,数据和各出现次,
故众数为:;
∵ 数据个数为,
中位数为第个数,
故中位数为:.
故选:D.
【变式2】.数据的方差等于 .
【答案】 2
【分析】本题考查了数据方差的计算,解决本题的关键是先计算平均值,再代入公式求解.
计算数据的方差,需先求平均值,再求各数据与平均值的差的平方,最后求这些平方的平均值.
【详解】解:数据的平均值为,
各数据与平均值的差分别为,平方后为,
这些平方的平均值为.
故答案为:2.
【变式3】.某小组位学生一次数学测试的分数为,,,,,,,,那么这个小组测试分数的标准差是 .
【答案】
【分析】先计算出这组数据的平均数,再依据方差的计算公式求出数据的方差,继而取方差的算术平方根即可.
【详解】解:这组数据的平均数为,
所以这个小组测试分数的方差是,
则这个小组测试分数的标准差是,
故答案为:.
【变式4】.某小组5名同学在一周内参加家务劳动的时间如下表所示,关于“劳动时间”的这组数据,以下说法正确的是( )
劳动时间(小时)
3
3.5
4
4.5
人数
1
1
2
1
A.中位数是4,平均数是3.8 B.众数是4,平均数是3.75
C.众数是2,平均数是3.75 D.众数是2,中位数是4
【答案】A
【分析】本题主要考查了求中位数、众数和平均数,解题的关键是掌握中位数、众数和平均数的定义,以及求中位数、众数和平均数的方法.根据中位数、众数的定义可得,求出该组数据的中位数和众数,再根据求平均数的方法和步骤计算平均数即可.
【详解】解:∵数据排序为3,3.5,4,4,4.5,
∴中位数是4,
∴平均数,
∵4小时出现次数最多,
∴众数是4.
故选:A.
题型03 根据方差公式求其他统计量
【典例1】.如果样本的方差为,那么它的样本容量为 ,平均数为 .
【答案】 3 8
【分析】此题考查了方差公式,解题的关键是根据方差的定义以及公式中各个字母所表示的意义.
在方差公式中,为样本容量,为平均数,据此即可求解.
【详解】解:由得它的样本容量为,平均数为,
故答案为:3,8.
【变式1】.一组数据的方差计算公式如下:,则这组数据的平均数是 .
【答案】
【分析】本题考查求方差和平均数,根据方差的计算公式,得到这组数据为,根据平均数的计算公式进行计算即可.
【详解】解:由题意,这组数据为,
平均数为:;
故答案为:.
【变式2】.已知一组数据的方差计算公式为,则这组数据的中位数是 ,标准差是 .
【答案】 2
【分析】本题考查方差,中位数,标准差.由方差的计算公式得出这组数据为0,2,2,4,据此可得中位数.再求出平均数,求出方差,最后求出标准差即可.
【详解】解:由方差的计算公式知,这组数据为0,2,2,4,
所以中位数为.平均数.
∴,
∴标准差是,
故答案为:2,.
题型04 计算频数、频率、组数、组距
【典例1】.“”中,字母“i”出现的频率为 .
【答案】
【分析】本题考查求频率,根据频率等于频数除以总数,进行求解即可.
【详解】解:由题意,字母“i”出现的频率是;
故答案为:.
【变式1】.已知在一个样本中,50个数据分别落在5个组内,第一、二、三、四、五组数据的个数分别是1,9,16,20,4,则第四组的频数是 .
【答案】20
【分析】本题是对频数的理解,根据各小组频数之和等于数据总和,进行计算.
【详解】解:根据题意得:第四组频数为第4组数据个数,故第四组频数为20.
故答案为:20.
【变式2】.一个样本容量为60的样本,最大值是135,最小值为60,取组距为10,则可以分成 组.
【答案】8
【分析】本题考查频率分布表中组数的确定,关键是求出最大值和最小值的差,然后除以组距,用进一法取整数值就是组数.先求出该组数据最大值与最小值的差,再用极差除以组距即可得到组数.
【详解】解:∵,而,
∴应该分成8组.
故答案为:8.
【变式3】.某校为了了解学生在校午餐所需的时间,抽查了20名同学在校午餐所需的时间,获得如 下数据(单位:分):10,12,15,10,16,18,19,18,20,34,22,25,20,18,18,20,15,16,21,16.若将这些数据分为5组,则组距是( )
A.4分 B.5分 C.6分 D.7分
【答案】B
【分析】本题考查了频数分布表的相关知识,找出20个数据的最大值与最小值,求出它们的差,再除以5即得结果,弄清题意,掌握求组距的方法是解题的关键.
【详解】解:根据题意得:.
即组距为5分.
故选:B.
【变式4】.某校九年级随机抽查一部分学生进行了1分钟仰卧起坐次数的测试,并将其绘制成如图所示的频数分布直方图.那么仰卧起坐次数在次的人数占抽查总人数的频率是 .
【答案】
【分析】本题考查由频数分布直方图数据求频率,看懂频数分布直方图得到相关数据是解决问题的关键.先由频数分布直方图得到仰卧起坐次数在次的人数为,总人数为,直接计算即可得到答案.
【详解】解:由频数分布直方图得到仰卧起坐次数在次的人数为,总人数为,
仰卧起坐次数在次的人数占抽查总人数的频率是,
故答案为:.
题型05 利用统计量做决策
【典例1】.一家鞋店在一段时间内销售了某种女鞋30双,销售量如表:根据表中的数据,可建议鞋店进货时,多进尺码为 的女鞋.
尺码
22
23
24
25
销售量/双
1
5
12
6
3
2
1
【答案】23
【分析】本题主要考查统计的有关知识,掌握平均数、中位数、众数、方差的意义是解题的关键.一组数据中出现次数最多的数据叫做众数.
根据众数的定义即可求解.
【详解】解:观察数据可知,23出现的次数最多,故鞋店多进一些同一尺码的鞋,该尺码为,
故答案为:.
【变式1】.学校为选拔数学竞赛选手,对甲、乙两名同学进行了4次模拟测试.已知两人成绩的方差分别为:,,且两人4次测试成绩如下:甲:78,82,79,81,乙:80,81,79,80,根据平均数和方差,应选 同学参赛.(填“甲”或“乙”)
【答案】乙
【分析】此题考查了方差的意义.通过计算平均成绩,甲和乙均为80,平均成绩相同;比较方差,乙的方差较小,成绩更稳定,因此选乙参赛.
【详解】解:甲的平均成绩为;
乙的平均成绩为.
两人平均成绩相同.
已知,,,
因此乙的成绩更稳定,应选乙同学参赛.
故答案为:乙.
【变式2】.某校要从甲、乙两个跳远运动员中挑选一人参加一项比赛.在最近的10次选拔赛中,他们的成绩(单位:)折线统计图如图所示:
历届比赛成绩表明,成绩达到就很可能夺冠.若为了稳妥夺冠,则应选择参赛的运动员是 (填“甲”或“乙”).
【答案】甲
【分析】本题考查平均数,中位数的意义,根据平均数,中位数的意义,以及样本中成绩达到夺冠的成绩判断即可.
【详解】解:∵甲成绩由小到大排列为:585,596,597,598,600,601,604,610,612,613,
∴甲成绩的中位数为:,
甲成绩的平均数为:;
∵乙成绩由小到大排列为:574,580,585,590,593,598,613,618,618,624,
∴乙成绩的中位数为:,
乙成绩的平均数为:,
∵甲成绩的平均数高于乙平均数,甲成绩的中位数高于乙中位数,从折线统计图可以看出甲的成绩波动较小,且甲10次成绩中有9次达到夺冠的成绩,乙只有5次达到夺冠的成绩,
∴应选择参赛的运动员是:甲.
故答案为:甲.
【变式3】.在某次体育测试中,甲、乙两班成绩的平均数、中位数、方差如下表:
班级
人数
平均数/分
中位数/分
方差
甲班
45
82
91
19.3
乙班
45
87
89
5.8
规定学生个人成绩大于90分为优秀,则甲、乙两班中优秀人数更多的是 班(填“甲”或“乙”).
【答案】甲
【分析】本题主要考查利用中位数做决策,根据平均分、中位数、方差的特点进行分析,班级人数相同,都为人,中位数为班级分数排序以后的第位同学的分数,甲班的分高于乙班分,则得出答案.
【详解】解:甲、乙两个班参赛人数都为人,由甲、乙两班成绩的中位数可知,甲班的优生人数大于等于人,乙班的小于等于人,
则甲班的优生人数较多,
故答案为:甲.
题型06 频数分布表、频数分布直方图
【典例1】.某校为了解七年级700名学生上学期参加社会实践活动的时间,随机对该年级部分学生进行了调查.根据收集的数据绘制了下面的频数分布直方图,则以下说法正确的是( )
A.一共调查了40名学生
B.图中五个小长方形的面积比是
C.估计七年级700名学生参加社会实践活动时间少于的有112名学生
D.随机抽取的学生中参加社会实践活动时间不少于的有32名的学生
【答案】C
【分析】本题考查了频数分布直方图,样本估计总体等;
A.由频数分布直方图可得调查的人数:,即可判断;
B.五个小长方形的面积比是,即可判断;
C.算出参加社会实践活动时间少于10h的有112名学生所占百分比,即可判断;
D.由频数分布直方图,即可判断;
会样本估计总体,能从频数分布直方图正确获取信息是解题的关键.
【详解】解:A.调查的人数:(名),结论不正确,故不符合题意;
B.五个小长方形的面积比是,结论不正确,故不符合题意;
C.(名),结论正确,故符合题意;
D.(名),结论不正确,故不符合题意;
故选:C.
【变式1】.为了了解全区近4800名初三学生数学学习状况,从中随机抽取500名学生的测试成绩作为样本,将他们的成绩整理后分组情况如下:(每组数据可含最低值,不含最高值)
分组(分)
40~50
50~60
60~70
70~80
80~90
90~100
频数
12
18
160
频率
0.18
0.04
根据上表信息,由此样本请你估计全区此次成绩在70~80分的人数大约是 .
【答案】1920
【分析】根据题意和表格中的数据,可以先计算出80~90和90~100的学生人数,然后即可计算出70~80的学生人数,再计算出全区此次成绩在70~80分的人数即可.
【详解】解:由题意可得,
80~90的学生有:500×0.18=90(人),
90~100学生有:500×0.04=20(人),
∴样本中70~80的学生有:50012181609020=200(人),
∴估计全区此次成绩在70~80分的人数大约是4800×=1920,
故答案为:1920.
【点睛】本题考查频数分布表、用样本估计总体,解答本题的关键是明确题意,求出样本中70~80分的人数.
【变式2】.为了解学生假期每天帮忙家长做家务活动情况,学校团委随机抽取了部分学生进行线上调查,并将调查结果绘制成频数直方图(不完整,每组含最小值,不含最大值),并且知道80~100分钟占所抽查学生的17.5%,根据提供信息,以下说法不正确的是( )
A.本次共随机抽取了40名学生;
B.抽取学生中每天做家务时间的中位数落在40~60分钟这一组;
C.如果全校有800名学生,那么每天做家务时间超过1小时的大约有300人;
D.扇形统计图中0~20分钟这一组的扇形圆心角的度数是30°;
【答案】D
【分析】由80~100分钟占所抽查学生的17.5%,且由条形统计图可知有7人,可得抽查总人数,即可判断A选项;通过总人数减去其他各组人数,得到60~80分钟的人数,根据中位数的定义(一组数据从小到大或从大到小排序后,最中间的数为中位数)即可判断B选项;由图中数据可得每天超过1小时的人数,然后用学校总人数乘以每天超过1小时的人数占抽查人数的比例即可判断C选项;根据扇形统计图圆心角得计算方法:乘以该组人数所占抽查总人数得比例即可判断D选项.
【详解】解:80~100分钟占所抽查学生的17.5%,且由条形统计图可知有7人,
∴抽查总人数为:,A选项正确;
60~80分钟的人数为:人,
先对数据排序后可得:最中间的数在第20,21之间,
,,
∴中位数落在60~80分钟这一组,故B选项正确;
从图中可得,每天超过1小时的人数为:人,
估算全校人数中每天超过1小时的人数为:人,故C选项正确;
0~20分钟这一组有4人,
扇形统计图中这一组的圆心角为:,故D选项错误;
故选:D.
【点睛】题目主要考查通过条形统计图获取信息及估算满足条件的总人数,中位数,扇形统计图圆心角的计算等,理解题意,熟练掌握基础知识点是解题关键.
题型07 频率分布直方图
【典例1】.如图,上海某有机草莓农场为了解今年草莓的收成情况,随机选择了一个大棚摘取草莓并逐一称重(精确到1g),绘制出频率分布直方图(每组数据含最低值,不含最高值).如果质量不小于20g的草莓为“大果”,则可估计500kg草莓中“大果”的总质量是( )
A.35kg B.170kg C.175kg D.380kg
【答案】C
【分析】用总质量乘以质量不小于20g的频率和即可.
【详解】解:估计500kg草莓中“大果”的总质量是500×(0.046+0.016+0.008)×5=175(kg),
故选:C.
【点睛】本题主要考查读频数分布直方图的能力和利用统计图获取信息的能力;利用统计图获取信息时,必须认真观察、分析、研究统计图,才能作出正确的判断和解决问题.
【变式1】.为了解全区5000名初中毕业生的体重情况,随机抽测了200名学生的体重,频率分布如图所示(每小组数据可含最小值,不含最大值),其中从左至右前六个小长方形的高依次为0.02、0.03、0.04、0.05、0.035、0.025,由此可估计全区初中毕业生的体重在50到55千克的学生人数约为 人.
【答案】1000
【分析】本题考查直方图,利用样本估计总体,从直方图获取信息,利用样本估计总体的思想进行求解即可.
【详解】解:由图可知:体重在50到55千克的学生的频率为,
(人);
故答案为:1000.
【变式2】.某校为了解本校学生每周阅读课外书籍的时间,对本校全体学生进行了调查,并绘制如图所示的频率分布直方图,那么图中这五个小矩形的面积之和为 .
【答案】1
【分析】本题考查了频率分布直方图.熟练掌握是解题的关键.
根据,可知五个小矩形的面积为频率和,然后作答即可.
【详解】解:∵,
∴五个小矩形的面积为频率和即为1,
故答案为:1.
一、单选题
1.下列调查中,哪一项适合用普查( )
A.夏季冷饮市场上的冰淇淋的质量 B.对学校设立读报角的看法
C.人们环境保护的意识 D.调查青年人对音乐的喜爱情况
【答案】B
【分析】本题考查了抽样调查和全面调查的区别,选择普查还是抽样调查要根据所要考查的对象的特征灵活选用,一般来说,对于具有破坏性的调查、无法进行普查、普查的意义或价值不大时,应选择抽样调查,对于精确度要求高的调查,事关重大的调查往往选用普查.
【详解】解:A、夏季冷饮市场上的冰淇淋,因数量巨大,且具有破坏性,不适用普查;
B、对学校设立读报角的看法,调查范围较小,适用普查;
C、D都是因为调查人数较大,调查耗时费力,不适用普查.
故选:B.
2.为了了解某地区初一年级4500名学生的体重情况,从中抽取了500名学生的体重,就这个问题来说,下面说法中正确的是( )
A.样本容量是500 B.每个学生是个体
C.500名学生是所抽取的一个样本 D.4500名学生是总体
【答案】A
【分析】本题考查了样本,个体以及样本容量等知识;根据总体是指考查的对象的全体,个体是总体中的每一个考查的对象,样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目即可作出判断.
【详解】解:A. 样本容量是500,故该选项正确,符合题意;
B. 每个学生的体重是个体,故该选项不正确,不符合题意;
C. 500名学生的体重是所抽取的一个样本,故该选项不正确,不符合题意;
D. 4500名学生的体重是总体,故该选项不正确,不符合题意;
故选:A.
3.下列调查中,选取的样本最具有代表性的是( )
A.调查某校名学生的体检情况,选取该校初二年级的学生进行调查
B.调查某校学生每周课余体育锻炼时间,选取该校体育社团中的名同学进行调查
C.为了解某社区老年人的健康状况,在该社区随机对名正在健身的老人进行调查
D.为了解某公司名员工的每日睡眠时长,随机选取该公司位员工进行调查
【答案】D
【分析】本题考查抽样调查的可靠性,根据抽取样本的注意事项是考虑样本的广泛性与代表性解题即可.理解抽样调查的可靠性、广泛性及代表性是解题的关键.
【详解】解:A.调查某校名学生的体检情况,选取该校初二年级的学生进行调查,不具代表性,故此选项不符合题意;
B.调查某校学生每周课余体育锻炼时间,选取该校体育社团中的名同学进行调查,不具代表性,故此选项不符合题意;
C.为了解某社区老年人的健康状况,在该社区随机对名正在健身的老人进行调查,不具代表性,故此选项不符合题意;
D.为了解某公司名员工的每日睡眠时长,随机选取该公司位员工进行调查,具有代表性,故此选项符合题意.
故选:D.
4.一组数据:3,4,4,6,8.这组数据的平均数是()
A.3 B.4 C.5 D.6
【答案】C
【分析】本题主要考查了平均数,掌握平均数的求法是解题的关键.
计算一组数据的平均数,只需将所有数据相加后除以数据的个数即可.
【详解】∵数据总和为,数据个数为5,
∴平均数为.
故选:C.
5.某校为了了解学生在校午餐所需的时间,抽取了20名学生在校午餐所需时间,获得如下的数据(单位:分):12、12、15、11、16、18、19、18、20、18、18、20、28、22、30、20、15、16、21、16.若将这些数据以4分为组距进行分组,则组数是( )
A.4组 B.5组 C.6组 D.7组
【答案】B
【分析】本题考查的是频数(率)分布表中的组数的计算,
根据组数=(最大值-最小值)÷组距(小数部分要进位)即可求解.
【详解】解:因为,
所以组数为5.
故选:B.
6.某农民在池塘里养了许多鱼,有草鱼、鲇鱼、鲤鱼、鲫鱼等,为了能更清楚地表示出各种鱼的条数,最适合使用的统计图是( )
A.扇形统计图 B.折线统计图 C.条形统计图 D.以上都可以
【答案】C
【分析】此题主要考查了统计图的选择.根据统计图的特点进行分析可得:扇形统计图表示的是部分在总体中所占的百分比,但一般不能直接从图中得到具体的数据;折线统计图表示的是事物的变化情况;条形统计图能清楚地表示出每个项目的具体数目.
根据统计图的特点进行判断即可.
【详解】解:条形统计图能清楚地表示出每个项目的具体数目,
∴为了能更清楚地表示出各种鱼的条数,最适合使用的统计图是条形图;
故选:C.
7.有一组数据分别为:,,,,;已知这组数的平均数为,那么这组数据的中位数是( ).
A. B. C. D.
【答案】C
【分析】本题考查了平均数和中位数的定义,解题的关键是掌握相关知识点.根据平均数的定义求出的值,再将数据排序后确定中位数.
【详解】解:平均数为,
,
,
数据为:,,,,,
排序后为:,,,,,
这组数据的中位数是,
故选:C.
8.如图是甲、乙两名同学的5次篮球训练中练习投篮成绩的折线统计图,下列判断正确的是( )
A.甲的成绩的中位数比乙的成绩的中位数大 B.甲的成绩的众数是9个
C.甲的成绩的平均数比乙的成绩的平均数大 D.甲的成绩比乙的成绩稳定
【答案】D
【分析】本题主要考查了中位数,平均数,众数,方差与稳定性之间的关系,折线统计图,根据折线统计图以及中位数,平均数和众数的定义来判断A、B、C,根据方差与稳定性之间的关系可判断D.
【详解】解:A、由统计图可知,甲的中位数为8个,乙的中位数为8个,故甲的中位数与乙的中位数相同,原说法错误,不符合题意;
B、由统计图可知,甲的众数是8个,原说法错误,不符合题意;
C、甲的平均数为个,乙的平均数为个,故甲的平均数与乙的平均数相同,原说法错误,不符合题意;
D、由统计图可知甲成绩的波动比乙成绩的波动小,故甲的成绩比乙的成绩稳定,原说法正确,符合题意;
故选:D.
9.为了调查全校师生对人工智能的熟悉程度,某数学小组对全校2000名师生发放了问卷,随机回收了800份,将回收问卷的调查结果绘制成统计图如图,由此估计全校师生对人工智能 “不了解”的约有( )
A.500人 B.750人 C.250人 D.1200人
【答案】C
【分析】本题主要考查用样本估计总体,总人数乘样本中对人工智能“不了解”的人数所占比例即可.
【详解】解:估计全校师生对人工智能“不了解”的约有(人),
故选:C.
10.如图,上海某有机草莓农场为了解今年草莓的收成情况,随机选择了一个大棚摘取草莓并逐一称重(精确到1g),绘制出频率分布直方图(每组数据含最低值,不含最高值).如果质量不小于20g的草莓为“大果”,则可估计500kg草莓中“大果”的总质量是( )
A.35kg B.170kg C.175kg D.380kg
【答案】C
【分析】用总质量乘以质量不小于20g的频率和即可.
【详解】解:估计500kg草莓中“大果”的总质量是500×(0.046+0.016+0.008)×5=175(kg),
故选:C.
【点睛】本题主要考查读频数分布直方图的能力和利用统计图获取信息的能力;利用统计图获取信息时,必须认真观察、分析、研究统计图,才能作出正确的判断和解决问题.
二、填空题
11.“神舟十八号”载人飞船于2024年4月25日在酒泉卫星发射中心发射,要想调查飞船零件的质量,适合采用 (填“普查”或“抽样调查”).
【答案】普查
【分析】本题考查抽样调查和全面调查(普查)的区别,选择普查还是抽样调查要根据所要考查的对象的特征灵活选用,一般来说,对于具有破坏性的调查、无法进行普查、普查的意义或价值不大,应选择抽样调查,对于精确度要求高的调查,事关重大的调查往往选用普查.据此判断即可解题.
【详解】解:飞船零件的质量事关重大,应选用普查.
故答案为:普查.
12.一组数据1,3,5,x的平均数与中位数相同,则x的值是 .
【答案】或3或7
【分析】本题主要考查了中位数和平均数,先根据平均数的定义求出平均数,再分当时,当时,当时,三种情况分别求出对应的中位数,再根据平均数和中位数相同建立方程求解即可.
【详解】解:由题意得,这组数据的平均数为,
当时,这组数据的中位数为,
∴,
解得;
当时,这组数据的中位数为,
∴,
解得;
当时,这组数据的中位数为,
∴,
解得;
综上所述,x的值是或3或7.
故答案为:或3或7.
13.一个射箭运动员连续射靶5次,所得环数分别是:8,6,10,7,9,则这个运动员所得环数的标准差为 .
【答案】
【详解】先由平均数的公式求得平均数的值,再根据方差的公式计算方差,最后计算标准差.
解:由题意知:= =8,
方差S2=[(8-8)2+(6-8)2+(10-8)2+(7-8)2+(9-8)2]=2
∴标准差是方差的算术平方根为.
故填.
点评:计算标准差需先算出方差,计算方差的步骤是:
(1)计算数据的平均数 ;
(2)计算偏差,即每个数据与平均数的差;
(3)计算偏差的平方和;
(4)偏差的平方和除以数据个数.
标准差即方差的算术平方根;
注意标准差和方差一样都是非负数.
14.某校为迎接“五四”青年节,举办了校园歌曲比赛.每名选手最后得分为去掉一个最高分和一个最低分后的平均分.已知七位评委给小萌的分数分别为:94,98,97,92,95,96,93,则小萌同学最后的得分为 分.
【答案】95
【分析】本题主要考查了求平均数,根据题意只需要计算出93、94、95、96、97这五个数的平均数即可得到答案.
【详解】解:,
∴小萌同学最后的得分为95分,
故答案为:95.
15.小明在计算一组数据的方差时,列出的算式如下:,根据算式信息,这组数据的平均数是 .
【答案】/
【分析】本题考查了方差,平均数.由,可知这组数据为7、7、8、8、8、9,然后根据平均数的定义求解作答即可.
【详解】解:∵,
∴这组数据为7、7、8、8、8、9,
∴这组数据的平均数为,
故答案为:.
16.已知某班学生理化实验操作测试成绩的统计结果如下表:
成绩(分)
4
5
6
7
8
9
10
人数
1
2
2
6
9
11
9
则这些学生成绩的众数是 分.
【答案】9
【分析】根据众数的定义:一组数据中出现次数最多的数据叫做众数,求解即可.
【详解】试题分析:根据众数的定义:一组数据中出现次数最多的数据叫做众数,求解即可.
解:这组数据出现次数最多的为:9,
故众数为9.
故答案为:9.
【点睛】本题考查了众数的定义,解答本题的关键是掌握一组数据中出现次数最多的数据叫做众数.
17.五种不发生反应的化合物Ⅰ、Ⅱ、Ⅲ、Ⅳ、V在一个密封的容器中,经过物质检验,得到如下两张图.如果条形图中每个横线刻度间的距离相等,那么化合物Ⅱ的质量是 .
【答案】72
【分析】本题考查了统计图.熟练掌握条形统计图和扇形统计图的互补性质,是解题的关键.根据化合物Ⅲ、Ⅴ的质量相差,与化合物Ⅲ、Ⅴ所占总质量的百分比,求出总质量,再求出化合物Ⅰ、Ⅱ的质量和,设化合物Ⅱ的质量为,列方程解答即可.
【详解】解:五种化合物的总质量,
化合物Ⅴ的质量,
化合物Ⅲ的质量,
化合物Ⅰ、Ⅱ的总质量,
设化合物Ⅱ的质量为,
∵条形图中每个横线刻度间的距离相等,
∴,
解得.
故答案为:72.
18.根据33个全国主要城市2023年7月的日照时数(单位:h),绘制了不完整的频数分布直方图如图所示(数据分成5组:,,,,).下面三个结论:①日照时数在范围的城市数量最少;②有4个城市日照时数在至(不含)的范围;③2023年7月,北京的日照时数是,比这33个全国主要城市中一半以上城市的日照时数都长.所有正确的结论的序号是 .
【答案】①②③
【分析】本题考查频数分布直方图.
根据条形图的高度即可判断①;根据各组频数之和等于总数求出至(不含)的范围的城市个数即可判断②;根据中位数的定义及意义求解可判断③.
【详解】解:①日照时数在范围的城市数量最少,正确;
②日照时数在至(不含)的范围的城市个数为(个),正确;
③这组数据的中位数落在组内,而2023年7月,北京的日照时数是大于中位数,
所以2023年7月,北京的日照时数是,比这33个全国主要城市中一半以上城市的日照时数都长,正确;
故答案为:①②③.
三、解答题
19.某校开展阳光体育运动,调查了七年级学生喜欢的球类活动(每人只选一项自己最喜欢的球类项目),并将调查情况制成如下统计表和统计图(不完整).请将统计表和统计图补充完整.
球类项目
乒乓球
篮球
足球
排球
人数
30人
______人
______人
______人
【答案】答案见解析
【分析】先求七年级喜欢球类的总人数,用喜欢乒乓球的人数除以喜欢乒乓球的人数占总人数的百分数;再求喜欢排球和篮球的人数,再求喜欢足球的人数占总人数的百分数,再补全图形即可.
【详解】解:,
∴喜欢篮球的有(人),
喜欢排球的有(人),
喜欢足球的有(人),
∴,
补全统计图表如下:
球类项目
乒乓球
篮球
足球
排球
人数
30人
30人
45人
15人
.
【点睛】此题主要考查的是如何观察扇形统计图并且从统计图中获取信息,然后再进行计算,理解题意与图形信息是解本题的关键.
20.七年级(5)班20名女生的身高如下(单位∶)∶
153 156 152 158 156 160 163 145 152 153
162 153 165 150 157 153 158 157 158 158
(1)请你在下表中填出身高在以下各个范围的频数,百分比(每个范围包含下限,但不包含上限):
身高
140~150
150~160
160~170
频数
百分比
(2)上表把身高分成___组,组距是___;
(3)身高在___范围的人数最多.
【答案】(1)见解析
(2)3;10
(3)150~160
【分析】(1)找出各个组中的人数;
(2)通过所给的数据把各个范围中的人数填入相应表格,根据所填写的信息及题意确定分成的组数、组距及哪个范围内的多;
(3)根据所填信息频数大小确定在哪个范围的人数最多.
【详解】(1)解:填表:
身高
140~150
150~160
160~170
频数
1
15
4
百分比
5%
75%
20%
(2)解:上表把身高分成3组,组距是10;
故答案为:3,10;
(3)解:∵,
∴身高在150~160范围最多.
故答案为:150~160
【点睛】本题考查的是从统计图表中获取信息.关键是找出各个组中的人数.通过所给的数据把各个范围中的人数填入相应表格,然后根据所填写的信息及题意确定分成的组数、组距及哪个范围内的多.锻炼了学生的统计能力.
21.甲、乙两人在5次打靶测试中命中的环数如下:甲:8,8,7,8,9;乙:5,9,7,10,9.
选手
平均数
众数
中位数
方差
甲
8
8
8
乙
9
3.2
(1)表格中__________,__________,______;
(2)教练根据这5次成绩,选择甲参加射击比赛,教练的理由是什么?
【答案】(1)8,9,0.4
(2)因为甲乙两人射击成绩的平均数相等,但甲的射击成绩的方差小,成绩比较稳定,所以选择甲参加射击比赛
【分析】本题主要考查平均数,众数,中位数及方差,熟练掌握平均数,众数,中位数及方差是解题的关键;
(1)根据平均数,中位数及方差可进行求解;
(2)根据平均数,方差可进行求解.
【详解】(1)解:由题意得:
,
把乙数据从小到大排列为,所以中位数,
;
故答案为8,9,0.4;
(2)解:选择甲参加射击比赛,教练的理由是甲乙两人射击成绩的平均数相等,但甲的射击成绩的方差小,成绩比较稳定,所以选择甲参加射击比赛.
22.某校计划组织学生参加学校书法、摄影、篮球、乒乓球四个课外兴趣小组,要求每人必须参加并且只能选择其中的一个小组,为了了解学生对四个课外小组的选择情况,学校从全体学生中随机抽取部分学生进行问卷调查,并把调查结果制成如下所示的两幅不完整的统计图
请根据给出的信息解答下列问题:
(1)求该校参加这次问卷调查的学生人数,并补全条形统计图;
(2) , ;
(3)若该校共有学生4000人,试估计该校选择“乒乓球”课外兴趣小组的学生有多少人?
【答案】(1)100人,条形图见解析
(2)36;16
(3)640人
【分析】本题考查统计的应用,熟练从图表上得到信息是解题的关键.
(1)根据条形图中选择“书法”的人数为人,扇形图中选择“书法”的人数所占百分比为,得到样本总人数,利用样本总人数与选择“篮球”的人数所占百分比,得出选择“篮球”的人数,补全条形图即可;
(2)根据学生选择的兴趣爱好的人数与样本总人数之比得到学生选择的兴趣爱好的人数所占百分比,据此进行计算求解即可;
(3)由(2)可知,选择“乒乓球”的人数所占百分比为,根据该校总人数与选择“乒乓球”的人数所占百分比得出该校选择“乒乓球”课外兴趣小组的学生人数即可.
【详解】(1)解:由扇形图可知:选择“书法”的人数所占百分比为,
由条形图可知:选择“书法”的人数为人,
因此样本总人数为:人
选择“篮球”的人数为:人
人数条形图如下:
答:该校参加这次问卷调查的学生人数为100人;
(2)解:由于选择“摄影”的有36人,选择“乒乓球”的有16人,该校参加这次问卷调查的学生人数为100人,
则、
因此、
故答案为:36、16;
(3)解:由(2)可知,选择“乒乓球”的人数所占百分比为,
因此该校选择“乒乓球”课外兴趣小组的学生为:(人).
答:该校选择“乒乓球”课外兴趣小组的学生为640人.
23.某社区准备在甲乙两位射箭爱好者中选出一人参加集训,两人各射了5箭,他们的总成绩(单位:环)相同,小宇根据他们的成绩绘制了尚不完整的统计图表,并计算了甲成绩的平均数和方差(见小宇的作业).
小宇的作业:
解:
甲、乙两人射箭成绩统计表
第1次
第2次
第3次
第4次
第5次
甲成绩
9
4
7
4
6
乙成绩
7
5
7
a
7
(1)______,______;
(2)请完成图中表示乙成绩变化情况的折线;
(3)①观察图,可看出______的成绩比较稳定(填“甲”或“乙”).
②请你从平均数和方差的角度分析,谁将被选中.
【答案】(1)4,6;
(2)见解析
(3)①乙;②乙将被选中.
【分析】本题主要考查了折线统计图,平均数和方差,灵活运用所学知识是解题的关键.
(1)先求出甲射箭5次的总环数,进而求出a的值,再根据平均数的定义求出乙的平均数即可;
(2)根据(1)所求结合表格中的数据补全统计图即可;
(3)①根据折线图可知乙的波动小,乙更稳定;②根据方差计算公式求出乙的方,再由二者平均数相同,乙的方差小,则乙被选择.
【详解】(1)解:由题意得,,
∴,
故答案为:4;6;
(2)解:如图所示,即为所求;
(3)解:①观察统计图可知,甲的成绩波动比乙的成绩波动大,故乙的成绩比较稳定;
故答案为:乙;
②
,
从平均数来看,两人的平均数相同,从方差来看,乙的方差小于甲的方差,即乙的成绩比甲稳定,因此应选择乙,即乙被选中.
24.近年来网约车给人们的出行带来了便利,小明和数学兴趣小组的同学对甲、乙两家网约车公司司机月收入进行了抽样调查,两家公司分别抽取的名司机月收入(单位:千元)如图所示:
根据以上信息,整理分析数据如下:
平均月收入/千元
中位数
众数
方差
甲公司
6
6
乙公司
4
(1)填空:_____,______;
(2)求出乙公司的平均月收入以及方差;()
(3)小明的叔叔计划从两家公司中选择一家做网约车司机,如果你是小明,你建议他选择哪家公司?请说明理由.
【答案】(1),6
(2),
(3)选择甲,理由见解析
【分析】本题考查条形统计图和扇形统计图信息关联.旨在考查学生的数据处理能力.
(1)众数是一组数据中出现次数最多的数值.中位数,是按顺序排列的一组数据中居于中间位置的一个数据(或最中间两个数据的平均数).据此即可求解;
(2)根据平均数和方差的求解公式即可求解;
(3)因为平均数相同,中位数、众数甲公司均大于乙公司,且甲公司方差小,更稳定,所以选甲公司.
【详解】(1)解:由扇形统计图和条形统计图可知:
;
(2)解:乙公司平均数:(千元);
乙公司方差:;
(3)解:建议选择甲.
理由:因为平均数相同,中位数、众数甲公司均大于乙公司,且甲公司方差小,更稳定,所以选甲公司.
25.空气质量指数(Air Quality Index,缩写AQI)是定量描述空气状况的非线性无量纲指数.其数值越大、级别和类别越高,说明空气污染状况越严重,对人体的健康危害也就越大,适用于表示某地区的短期空气质量状况和变化趋势.(空气污染指数为0~50是优;空气污染指数为50~100是良好;空气污染指数为100~150是轻度污染;空气污染指数为150~200是中度污染;空气污染指数为200~250是重度污染.)
如图表示的是某地区2022年11月份30天日均AQI指数的频率分布直方图.
空气质量指数(AQI)
0~50
50~100
100~150
150~200
200~250
天数
3
3
3
频率
0.1
0.1
0.1
(注:每组数据可含最高值,不含最低值)
(1)请你根据上述频率分布直方图及表格完成下面的填空:
这个地区11月份空气为轻度污染的天数是________天.________;________;________;________.
(2)为了进一步改善生活环境和空气质量,提高人民的生活质量,当地政府计划从2023年开始增加绿化面积.已知2022年底该地区的绿化面积为20万亩,如果到2024年底,该地区的绿化面积比为2022年的绿化面积增加了50%,假设这两年绿化面积的年增长率相同,求这两年中绿化面积每年的增长率(精确到0.01)(参考数据:,,,)
【答案】(1)3,12,9,0.4,0.3
(2)
【分析】(1)根据样本容量=天数÷频率,求得样本容量,根据计算出良好的频率,后运用公式依次计算即可.
(2)设平均增长率为x,根据题意得计算即可.
【详解】(1)根据题意,得轻度污染天数为3天,样本容量为:,
∵,
∴良好天气的频率为,
∴优秀天气的频率为,
∴,
∴优秀天气的频率为,
故答案为:3,12,9,0.4,0.3.
(2)设平均增长率为x,根据题意得,
解得,
∵,
∴或(舍去)
故这两年中绿化面积每年的增长率为.
【点睛】本题考查了频数分布表,一元二次方程的增长率问题,熟练掌握频数分布表,增长率问题是解题的关键.
2 / 17
学科网(北京)股份有限公司
$
第28章 统计初步
教学目标
1. 学习数据描述的方法;统计图的选择;
2. 知道统计的意义;学会用样本估计总体;
3. 会求平均数,加权平均数,截尾平均数;
4. 了解中位数与众数的统计意义;会求方差与标准差;学会用它们做决策;
5. 掌握频数分布直方图;频率分布直方图及其应用。
教学重难点
1.重点
(1)统计图;
(2)表示一组数据平均水平的量;表示一组数据波动程度平的量;
(3)表示一组数据分布量。
2.难点
(1)平均数、中位数、众数等含参数问题;
(2)统计初步的综合应用。
知识点1 数据整理与表示 统计的意义
一、数据的描述
描述数据的方法有两种:统计表和统计图.
统计表:利用表格将要统计的数据填入相应的表格内,表格统计法可以很好地整理数据
统计图:利用“条形图”、“扇形图”、“折线图”描述数据,这样做的最大优点是将表格中的数据所呈现出来的信息直观化.
要点:
(1)条形统计图:用线段长度表示数据,根据数据的多少画成长短不同的长方形直条,然后按顺序把这些直条排列起来,条形统计图很容易看出数据的大小,便于比较,但不能清楚地反映各部分占总体的百分比.
(2)扇形统计图:用整个圆表示总体,用圆内各个扇形的大小表示各部分数量,从扇形上可清楚地看出各部分量和总数量之间的关系,但不能直接表示出各个项目的具体数据.
(3)折线统计图:用一个单位长度表示一定的数量,根据数量的多少描出各点,然后把各点用线段依次连接起来,折线图不但可以表示出数量的多少,而且能够清楚地表示出数量的增减变化情况,但不能清楚地反映数据的分布情况.
二、统计图的选择
统计图:利用“条形图”、“扇形图”、“折线图”描述数据,这样做的最大优点是将表格中的数据所呈现出来的信息直观化.
要点:
(1)条形统计图:用线段长度表示数据,根据数据的多少画成长短不同的长方形直条,然后按顺序把这些直条排列起来,条形统计图很容易看出数据的大小,便于比较,但不能清楚地反映各部分占总体的百分比.
(2)扇形统计图:用整个圆表示总体,用圆内各个扇形的大小表示各部分数量,从扇形上可清楚地看出各部分量和总数量之间的关系,但不能直接表示出各个项目的具体数据.
(3)折线统计图:用一个单位长度表示一定的数量,根据数量的多少描出各点,然后把各点用线段依次连接起来,折线图不但可以表示出数量的多少,而且能够清楚地表示出数量的增减变化情况,但不能清楚地反映数据的分布情况.
三、统计的意义
1.统计学相关概念
总体:调查时,调查对象的全体叫做总体.
个体:组成总体的每一个调查对象叫做个体.
样本:从总体中取出的一部分个体叫做总体的一个样本.
样本容量:样本中个体的数量叫做样本容量(不带单位).
要点:
(1)“调查对象的全体”一般是指调查对象的某种数量指标的全体,如对于一个班级,如果考察的是这个班学生的身高,那么总体是指这个班学生身高的全体,不能错误地理解为学生的全体是总体.
(2)样本是总体的一部分,一个总体中可以有许多样本,样本在一定程度上能够反映总体,为了使样本能较好地反映总体情况,在选取样本时要注意使其具有一定的代表性.
(3) 样本容量是一个数字,不能有单位.一般地,样本容量越大,通过样本对总体的估计越精确,在实际研究中,要根据具体情况确定样本容量的大小.例如:“从5万名考生的数学成绩中抽取2000名考生的数学成绩进行分析”,样本是“2000名考生的数学成绩”,而样本容量是“2000”,不能将其误解为“2000名考生”或“2000名”.
2. 调查的方法:普查和抽样调查
(1)普查:考察全体对象的调查叫做普查.
要点:
(1)普查又叫“普查”,它是指在统计的过程中,为了某种特定的目的而对所有考察的对象一一作出的调查,在记录数据时,通常用划记法进行记录数据.
(2)一般来说,普查能够得到全体被调查对象的全面、准确的信息,但有时总体中的个体的数目非常大,普查的工作量太大;有时受条件的限制,无法进行普查;有时调查具有破坏性(例如:测试一批灯泡的使用寿命或炮弹的杀伤半径等),不能进行普查.
(2)抽样调查:从调查对象中抽取部分对象进行调查,然后根据调查的数据推断全体对象的情况,这种调查方式称为抽样调查.
要点:
(1)从总体中抽取部分个体进行调查的方式,我们称抽样调查,在抽取的过程中,总体中的每一个个体都有相等的机会被抽到,像这样的抽样方式是一种简单随机抽样.
(2)抽样调查方便、快捷,能够减少调查统计的工作量但调查的结果不如“普查”得到的结果准确.
(3)调查方法的选择:
①普查是对考查对象的全体调查,它要求对考查范围内所有个体进行一个不漏的逐个准确统计;而抽样调查则只是对总体中的部分个体进行调查,以样本来估计总体的情况.
②在调查实际生活中的相关问题时,要灵活处理,既要考虑问题本身的需要,又要考虑实现的可能性和所付出代价的大小.
3. 随机样本
具有代表性的样本叫作随机样本。
4. 用样本估计总体
比如在保护区内不同的地方,将20只黑叶猴背上涂一个色块做标记,再放归野外,一个月后如果在保护区内不同的地方观察到60只黑叶猴,发现其中2只黑叶猴有记号,那么我们就能粗略估计该自然保护区里黑叶猴的数量,这里假定有记号的黑叶猴在自然保护区里是均匀分布的,观察到的黑叶猴又是随机的,因此60只黑叶猴中出现有记号的黑叶猴数与60的比,应该与保护区所有黑叶猴中存在20只有记号的黑叶猴数与黑叶猴总数的比大致相同.
经计算,自然保护区里大约有600只黑叶猴.
【即学即练】
1.下列调查中,适宜采用抽样调查的是( )
A.调查冬奥会高山滑雪运动员兴奋剂的使用情况
B.调查某批次汽车的抗撞击能力
C.神舟二十一号载人飞船发射前对零部件的检查
D.调查全班观看电影《哪吒2》的情况
2.要制作空气中各成分所占百分比,选取的统计图是( )
A.条形统计图 B.折线统计图
C.扇形统计图 D.三种都可以
3.为了解某校七年级名学生参加社团的情况,小郑随机抽取部分学生进行调查统计,并绘制如图所示的扇形统计图,那么下列说法不正确的是( )
A.参加编程的学生有人
B.参加摄影所在扇形的圆心角度数为
C.参加编程的人数是参加合唱人数的2倍
D.参加其他社团的人数占总人数的10%
4.甲、乙两家超市1~8月的月利润情况如图所示,下列说法中,不正确的是( )
A.甲超市的月利润逐月减少 B.4~8月乙超市的月利润逐月减少
C.3月甲、乙两家超市的月利润相等 D.6月甲、乙两家超市的月利润相差最大
知识点2 表示一组数据平均水平的量
一、平均数和加权平均数
一般地,对于个数,我们把叫做这个数的平均数,记作.计算公式为.
要点:
平均数表示一组数据的“平均水平”,反映了一组数据的集中趋势.
(1)当一组数据较大时,并且这些数据都在某一常数附近上、下波动时,一般选用简化计算公式.其中为新数据的平均数,为取定的接近这组数据的平均数的较“整”的数.
(2)平均数的大小与一组数据里的每个数据均有关系,其中任一数据的变动都会相应引起平均数的变动.所以平均数容易受到个别特殊值的影响.
若个数的权分别是,则叫做这个数的加权平均数.
要点:
(1)相同数据的个数叫做权,越大,表示的个数越多,“权”就越重. 数据的权能够反映数据的相对“重要程度”.
(2)加权平均数实际上是算术平均数的另一种表现形式,是平均数的简便运算.
二、样本平均数与总体平均数
我们把样本年琬有个体的平均数称为样本平均数;把总体中所有个体的平均数称为总体平均数随机样本的容量越大,样本平均数就越接近于总体平均数必要时,可以用样本平均数来估计总体平均数.
三、截尾平均数
截尾平均数:去掉一个最大值,去掉一个最小值,剩下的数求平均数。
四、中位数和众数
1.中位数的概念:将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数称为这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数称为这组数据的中位数.
要点:(1)一组数据的中位数是唯一的;一组数据的中位数不一定出现在这组数据中.
(2)由一组数据的中位数可以知道中位数以上和以下数据各占一半.
2.众数的概念:一组数据中出现次数最多的数据称为这组数据的众数.
要点:(1)一组数据的众数一定出现在这组数据中;一组数据的众数可能不止一个;如果所有数据出现的次数都一样,那么这组数据就没有众数.
(2)众数是一组数据中出现次数最多的数据而不是数据出现的次数.
五、平均数、中位数与众数的联系与区别
联系:平均数、众数、中位数都是用来描述数据集中趋势的量,其中以平均数最为重要.
区别:平均数的大小与每一个数据都有关,任何一个数的波动都会引起平均数的波动,当一组数据中有个别数据太高或太低,用平均数来描述整体趋势则不合适,用中位数或众数则较合适.中位数与数据排列位置有关,个别数据的波动对中位数没影响;众数主要研究各数据出现的频数,当一组数据中不少数据多次重复出现时,可用众数来描述.
【即学即练】
1.有一组数据:6,4,6,5,3,则这组数据的平均数、众数、中位数分别是( )
A.5,6,5 B.5,5,5 C.,6,6 D.,6,5
2.一名射击运动员连续射靶8次,命中的环数如下:8,9,10,9,7,8,10,8.这名运动员射击环数的众数与中位数分别是( )
A.9环与8环 B.8环与8.5环 C.8.5环与9环 D.8环与8环
3.为建设生态城市,某中学在植树节那天,组织九年级八个班的学生到西城新区植树,各班植树情况如下表:
班级
一
二
三
四
五
六
七
八
合计
棵数
15
18
22
25
29
14
18
19
160
这组数据的中位数、众数分别是( )
A.18,18 B.18.5,18 C.19,19 D.19.5,19
知识点3 表示一组数据波动程度的量
一、*极差、方差和标准差
用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围,用这种方法得到的差称为*极差,*极差=最大值-最小值.
要点:极差是最简单的一种度量数据波动情况的量,它受极端值的影响较大.一组数据极差越小,这组数据就越稳定.
方差是反映一组数据的整体波动大小的特征的量.方差的计算公式是:
要点:(1)方差反映的是一组数据偏离平均值的情况.方差越大,数据的波动越大;方差越小,数据的波动越小.
(2)一组数据的每一个数都加上(或减去)同一个常数,所得的一组新数据的方差不变.
(3)一组数据的每一个数据都变为原来的倍,则所得的一组新数据的方差变为原来的倍.
方差的算术平方根叫做这组数据的标准差,用符号表示,即:
;标准差的数量单位与原数据一致.
二、*极差、方差和标准差的联系与区别
联系:*极差与方差、标准差都是表示一组数据离散程度的特征数.
区别:*极差表示一组数据波动范围的大小,它受极端数据的影响较大;方差反映了一组数据与其平均值的离散程度的大小.方差越大,稳定性也越小;反之,则稳定性越好.所以一般情况下只求一组数据的波动范围时用极差,在考虑到这组数据的稳定性时用方差.
三、用样本估计总体
在考察总体的平均水平或方差时,往往都是通过抽取样本,用样本的平均水平或方差近似估计得到总体的平均水平或方差.
要点:(1)如果总体数量太多,或者从总体中抽取个体的试验带有破坏性,都应该抽取样本.取样必须具有尽可能大的代表性.
(2) 用样本估计总体时,样本容量越大,样本对总体的估计也越精确.样本容量的确定既要考虑问题本身的需要,又要考虑实现的可能性所付出的代价.
【即学即练】
1.某小组位学生一次数学测试的分数为,,,,,,,,那么这个小组测试分数的标准差是 .
2.在一场物理实验探究中,甲、乙、丙、丁四名同学分别对同一测量仪器进行10次测量操作,他们测量的平均值相同,测量数据的方差分别是,,,,则这四名同学中测量成绩最稳定的是( )
A.甲 B.乙 C.丙 D.丁
3.甲、乙两地4月下旬的日平均气温统计图如图所示,那么由图中信息可知甲、乙两地这10天日平均气温比较稳定的是 .(填“甲”或“乙”)
4.小莹在计算一组数据的方差时,列出没有化简的算式:关于这组数据,下列说法正确的是( )
①平均数是;②众数是;③中位数是;④样本容量是.
A.①② B.③④ C.①③ D.②④
5.已知一组数据的平均数是2,方差是,那么另一组数据的平均数是 ,方差是 .
知识点4 表示一组数据分布的量
一、组距、频数、频率与频数分布表
1.组距:把所有数据分成若干组,每个小组的两个端点之间的距离(组内数据的取值范围).
2. 频数:在统计数据时,某个对象出现的次数或落在某个组别中的数据的个数称为频数.
3. 频率:频数与总次数的比值称为频率.
4.频数分布表:把各个组别中相应的频数分布用表格的形式表示出来,所得表格就是频数分布表.
频数分布表能清楚地反映一组数据的大小分布情况.将一批数据分组,一般数据越多,分的组也越多.当数据在100个以内时,按照数据的多少,常分成5~12组.在分组时,要灵活确定组距,使所分组数合适,一般组数为的整数部分+1.
要点:
(1)频数之和等于样本容量,各频率之和等于1;
(2)制作频数分布表的一般步骤:①计算最大值与最小值的差;②决定组距和组数;③确定分点;④列频数分布表.
二、频数分布直方图
1.频数分布直方图
根据频数分布表,用横轴表示各分组数据、纵轴表示各组数据的频数,绘制条形统计图.这样的条形统计图,直观地呈现了频数的分布特征和变化规律,称为频数分布直方图.
2.画频数分布直方图的步骤
(1)计算最大值与最小值的差;
(2)决定组距与组数;
(3)列频数分布表;
(4)画频数分布直方图.
3. 频数分布直方图与条形图的联系与区别
(1)联系:它们都是用矩形来表示数据分布情况的;当矩形的宽度相等时,都是用矩形的高来表示数据分布情况的;频数分布直方图是特殊的条形统计图.
(2)区别:①由于分组数据具有连续性,频数分布直方图中各“条形”之间通常是连续排列,中间没有间隙,而条形图中各“条形”是分开排列的,中间有一定的间隙;②条形统计图用横向指标表示考察对象的类别,用纵向指标表示不同对象的数量. 频数分布直方图横向指标表示考察对象数据的变化范围,用纵向指标表示相应范围内数据的频数.
要点:
(1)频数分布直方图简称直方图,它是条形统计图的一种.
(2)注意直方图与条形图、扇形图、折线图在表示数据方面的优缺点.
三、频率分布直方图:通常在频率分布直方图中,用每小组对应的小矩形的面积表示该小组的组频率.因此在频率分布直方图中,纵轴表示频率与组距的商,即,横轴的意义与频数分布直方图相同。
【即学即练】
1.已知一个50个数据的样本,把它分成6组,第一组到第四组的频数分别是8、6、11、7,第五组的频率是,那么第六组的频数是 .
2.一组数共有80个,最大值是136,最小值是52,用频数分布直方图描述这一数据,取组距为10,则可以分成 组.
3.某学校对部分学生的睡眠时间进行调查统计,得到的频数分布直方图(每组含前一个边界值,不含后一个边界值)如图所示,其中睡眠时间在小时的学生所占百分比为,则睡眠时间在小时的学生有 人.
4.某区有1200名学生参加了“垃圾分类"知识竞赛,为了解本次竞赛成绩分布情况,竞赛组委会从中随机抽取部分学生的成绩(得分都是整数)作为样本,绘制成频率分布直方图(如图) .请根据提供的信息估计该区本次竞赛成绩在89.5分~ 99.5分的学生有 名.
题型01 统计的意义
【典例1】.下列调查中,适宜采用普查方式的是( )
A.调查一批新型节能灯泡的使用寿命
B.调查上海市中小学生的课外阅读时间
C.全市中学生对《流浪地球》影评
D.对我国六代战斗机“歼﹣36”试飞前整机零部件质量的调查
【变式1】.为了解某校学生的睡眠时间,下列抽样调查中样本具有代表性的是( )
A.选择九年级一个班的学生进行调查;
B.选择全校的男生进行调查;
C.对全校成绩排名前的学生进行调查;
D.每个班级随机抽取的学生进行调查.
【变式2】.某校为了了解学生对“二十四节气”的知晓情况,从全校6000名学生中,随机抽取了120名学生进行调查,在这次调查中( )
A.6000名学生是总体
B.所抽取的120名学生是总体的一个样本
C.6000名是样本容量
D.所抽取的120名学生对“二十四节气”的知晓情况是总体的一个样本
题型02 求平均数、中位数、众数、方差、标准差
【典例1】.一组数据:3,4,4,6,8.这组数据的平均数是()
A.3 B.4 C.5 D.6
【变式1】.一组数据:,,,,,,,这组数据的众数和中位数分别是( ).
A., B., C., D.,
【变式2】.数据的方差等于 .
【变式3】.某小组位学生一次数学测试的分数为,,,,,,,,那么这个小组测试分数的标准差是 .
【变式4】.某小组5名同学在一周内参加家务劳动的时间如下表所示,关于“劳动时间”的这组数据,以下说法正确的是( )
劳动时间(小时)
3
3.5
4
4.5
人数
1
1
2
1
A.中位数是4,平均数是3.8 B.众数是4,平均数是3.75
C.众数是2,平均数是3.75 D.众数是2,中位数是4
题型03 根据方差公式求其他统计量
【典例1】.如果样本的方差为,那么它的样本容量为 ,平均数为 .
【变式1】.一组数据的方差计算公式如下:,则这组数据的平均数是 .
【变式2】.已知一组数据的方差计算公式为,则这组数据的中位数是 ,标准差是 .
题型04 计算频数、频率、组数、组距
【典例1】.“”中,字母“i”出现的频率为 .
【变式1】.已知在一个样本中,50个数据分别落在5个组内,第一、二、三、四、五组数据的个数分别是1,9,16,20,4,则第四组的频数是 .
【变式2】.一个样本容量为60的样本,最大值是135,最小值为60,取组距为10,则可以分成 组.
【变式3】.某校为了了解学生在校午餐所需的时间,抽查了20名同学在校午餐所需的时间,获得如 下数据(单位:分):10,12,15,10,16,18,19,18,20,34,22,25,20,18,18,20,15,16,21,16.若将这些数据分为5组,则组距是( )
A.4分 B.5分 C.6分 D.7分
【变式4】.某校九年级随机抽查一部分学生进行了1分钟仰卧起坐次数的测试,并将其绘制成如图所示的频数分布直方图.那么仰卧起坐次数在次的人数占抽查总人数的频率是 .
题型05 利用统计量做决策
【典例1】.一家鞋店在一段时间内销售了某种女鞋30双,销售量如表:根据表中的数据,可建议鞋店进货时,多进尺码为 的女鞋.
尺码
22
23
24
25
销售量/双
1
5
12
6
3
2
1
【变式1】.学校为选拔数学竞赛选手,对甲、乙两名同学进行了4次模拟测试.已知两人成绩的方差分别为:,,且两人4次测试成绩如下:甲:78,82,79,81,乙:80,81,79,80,根据平均数和方差,应选 同学参赛.(填“甲”或“乙”)
【变式2】.某校要从甲、乙两个跳远运动员中挑选一人参加一项比赛.在最近的10次选拔赛中,他们的成绩(单位:)折线统计图如图所示:
历届比赛成绩表明,成绩达到就很可能夺冠.若为了稳妥夺冠,则应选择参赛的运动员是 (填“甲”或“乙”).
【变式3】.在某次体育测试中,甲、乙两班成绩的平均数、中位数、方差如下表:
班级
人数
平均数/分
中位数/分
方差
甲班
45
82
91
19.3
乙班
45
87
89
5.8
规定学生个人成绩大于90分为优秀,则甲、乙两班中优秀人数更多的是 班(填“甲”或“乙”).
题型06 频数分布表、频数分布直方图
【典例1】.某校为了解七年级700名学生上学期参加社会实践活动的时间,随机对该年级部分学生进行了调查.根据收集的数据绘制了下面的频数分布直方图,则以下说法正确的是( )
A.一共调查了40名学生
B.图中五个小长方形的面积比是
C.估计七年级700名学生参加社会实践活动时间少于的有112名学生
D.随机抽取的学生中参加社会实践活动时间不少于的有32名的学生
【变式1】.为了了解全区近4800名初三学生数学学习状况,从中随机抽取500名学生的测试成绩作为样本,将他们的成绩整理后分组情况如下:(每组数据可含最低值,不含最高值)
分组(分)
40~50
50~60
60~70
70~80
80~90
90~100
频数
12
18
160
频率
0.18
0.04
根据上表信息,由此样本请你估计全区此次成绩在70~80分的人数大约是 .
【变式2】.为了解学生假期每天帮忙家长做家务活动情况,学校团委随机抽取了部分学生进行线上调查,并将调查结果绘制成频数直方图(不完整,每组含最小值,不含最大值),并且知道80~100分钟占所抽查学生的17.5%,根据提供信息,以下说法不正确的是( )
A.本次共随机抽取了40名学生;
B.抽取学生中每天做家务时间的中位数落在40~60分钟这一组;
C.如果全校有800名学生,那么每天做家务时间超过1小时的大约有300人;
D.扇形统计图中0~20分钟这一组的扇形圆心角的度数是30°;
题型07 频率分布直方图
【典例1】.如图,上海某有机草莓农场为了解今年草莓的收成情况,随机选择了一个大棚摘取草莓并逐一称重(精确到1g),绘制出频率分布直方图(每组数据含最低值,不含最高值).如果质量不小于20g的草莓为“大果”,则可估计500kg草莓中“大果”的总质量是( )
A.35kg B.170kg C.175kg D.380kg
【变式1】.为了解全区5000名初中毕业生的体重情况,随机抽测了200名学生的体重,频率分布如图所示(每小组数据可含最小值,不含最大值),其中从左至右前六个小长方形的高依次为0.02、0.03、0.04、0.05、0.035、0.025,由此可估计全区初中毕业生的体重在50到55千克的学生人数约为 人.
【变式2】.某校为了解本校学生每周阅读课外书籍的时间,对本校全体学生进行了调查,并绘制如图所示的频率分布直方图,那么图中这五个小矩形的面积之和为 .
一、单选题
1.下列调查中,哪一项适合用普查( )
A.夏季冷饮市场上的冰淇淋的质量 B.对学校设立读报角的看法
C.人们环境保护的意识 D.调查青年人对音乐的喜爱情况
2.为了了解某地区初一年级4500名学生的体重情况,从中抽取了500名学生的体重,就这个问题来说,下面说法中正确的是( )
A.样本容量是500 B.每个学生是个体
C.500名学生是所抽取的一个样本 D.4500名学生是总体
3.下列调查中,选取的样本最具有代表性的是( )
A.调查某校名学生的体检情况,选取该校初二年级的学生进行调查
B.调查某校学生每周课余体育锻炼时间,选取该校体育社团中的名同学进行调查
C.为了解某社区老年人的健康状况,在该社区随机对名正在健身的老人进行调查
D.为了解某公司名员工的每日睡眠时长,随机选取该公司位员工进行调查
4.一组数据:3,4,4,6,8.这组数据的平均数是()
A.3 B.4 C.5 D.6
5.某校为了了解学生在校午餐所需的时间,抽取了20名学生在校午餐所需时间,获得如下的数据(单位:分):12、12、15、11、16、18、19、18、20、18、18、20、28、22、30、20、15、16、21、16.若将这些数据以4分为组距进行分组,则组数是( )
A.4组 B.5组 C.6组 D.7组
6.某农民在池塘里养了许多鱼,有草鱼、鲇鱼、鲤鱼、鲫鱼等,为了能更清楚地表示出各种鱼的条数,最适合使用的统计图是( )
A.扇形统计图 B.折线统计图 C.条形统计图 D.以上都可以
7.有一组数据分别为:,,,,;已知这组数的平均数为,那么这组数据的中位数是( ).
A. B. C. D.
8.如图是甲、乙两名同学的5次篮球训练中练习投篮成绩的折线统计图,下列判断正确的是( )
A.甲的成绩的中位数比乙的成绩的中位数大 B.甲的成绩的众数是9个
C.甲的成绩的平均数比乙的成绩的平均数大 D.甲的成绩比乙的成绩稳定
9.为了调查全校师生对人工智能的熟悉程度,某数学小组对全校2000名师生发放了问卷,随机回收了800份,将回收问卷的调查结果绘制成统计图如图,由此估计全校师生对人工智能 “不了解”的约有( )
A.500人 B.750人 C.250人 D.1200人
10.如图,上海某有机草莓农场为了解今年草莓的收成情况,随机选择了一个大棚摘取草莓并逐一称重(精确到1g),绘制出频率分布直方图(每组数据含最低值,不含最高值).如果质量不小于20g的草莓为“大果”,则可估计500kg草莓中“大果”的总质量是( )
A.35kg B.170kg C.175kg D.380kg
二、填空题
11.“神舟十八号”载人飞船于2024年4月25日在酒泉卫星发射中心发射,要想调查飞船零件的质量,适合采用 (填“普查”或“抽样调查”).
12.一组数据1,3,5,x的平均数与中位数相同,则x的值是 .
13.一个射箭运动员连续射靶5次,所得环数分别是:8,6,10,7,9,则这个运动员所得环数的标准差为 .
14.某校为迎接“五四”青年节,举办了校园歌曲比赛.每名选手最后得分为去掉一个最高分和一个最低分后的平均分.已知七位评委给小萌的分数分别为:94,98,97,92,95,96,93,则小萌同学最后的得分为 分.
15.小明在计算一组数据的方差时,列出的算式如下:,根据算式信息,这组数据的平均数是 .
16.已知某班学生理化实验操作测试成绩的统计结果如下表:
成绩(分)
4
5
6
7
8
9
10
人数
1
2
2
6
9
11
9
则这些学生成绩的众数是 分.
17.五种不发生反应的化合物Ⅰ、Ⅱ、Ⅲ、Ⅳ、V在一个密封的容器中,经过物质检验,得到如下两张图.如果条形图中每个横线刻度间的距离相等,那么化合物Ⅱ的质量是 .
18.根据33个全国主要城市2023年7月的日照时数(单位:h),绘制了不完整的频数分布直方图如图所示(数据分成5组:,,,,).下面三个结论:①日照时数在范围的城市数量最少;②有4个城市日照时数在至(不含)的范围;③2023年7月,北京的日照时数是,比这33个全国主要城市中一半以上城市的日照时数都长.所有正确的结论的序号是 .
三、解答题
19.某校开展阳光体育运动,调查了七年级学生喜欢的球类活动(每人只选一项自己最喜欢的球类项目),并将调查情况制成如下统计表和统计图(不完整).请将统计表和统计图补充完整.
球类项目
乒乓球
篮球
足球
排球
人数
30人
______人
______人
______人
20.七年级(5)班20名女生的身高如下(单位∶)∶
153 156 152 158 156 160 163 145 152 153
162 153 165 150 157 153 158 157 158 158
(1)请你在下表中填出身高在以下各个范围的频数,百分比(每个范围包含下限,但不包含上限):
身高
140~150
150~160
160~170
频数
百分比
(2)上表把身高分成___组,组距是___;
(3)身高在___范围的人数最多.
21.甲、乙两人在5次打靶测试中命中的环数如下:甲:8,8,7,8,9;乙:5,9,7,10,9.
选手
平均数
众数
中位数
方差
甲
8
8
8
乙
9
3.2
(1)表格中__________,__________,______;
(2)教练根据这5次成绩,选择甲参加射击比赛,教练的理由是什么?
22.某校计划组织学生参加学校书法、摄影、篮球、乒乓球四个课外兴趣小组,要求每人必须参加并且只能选择其中的一个小组,为了了解学生对四个课外小组的选择情况,学校从全体学生中随机抽取部分学生进行问卷调查,并把调查结果制成如下所示的两幅不完整的统计图
请根据给出的信息解答下列问题:
(1)求该校参加这次问卷调查的学生人数,并补全条形统计图;
(2) , ;
(3)若该校共有学生4000人,试估计该校选择“乒乓球”课外兴趣小组的学生有多少人?
23.某社区准备在甲乙两位射箭爱好者中选出一人参加集训,两人各射了5箭,他们的总成绩(单位:环)相同,小宇根据他们的成绩绘制了尚不完整的统计图表,并计算了甲成绩的平均数和方差(见小宇的作业).
小宇的作业:
解:
甲、乙两人射箭成绩统计表
第1次
第2次
第3次
第4次
第5次
甲成绩
9
4
7
4
6
乙成绩
7
5
7
a
7
(1)______,______;
(2)请完成图中表示乙成绩变化情况的折线;
(3)①观察图,可看出______的成绩比较稳定(填“甲”或“乙”).
②请你从平均数和方差的角度分析,谁将被选中.
24.近年来网约车给人们的出行带来了便利,小明和数学兴趣小组的同学对甲、乙两家网约车公司司机月收入进行了抽样调查,两家公司分别抽取的名司机月收入(单位:千元)如图所示:
根据以上信息,整理分析数据如下:
平均月收入/千元
中位数
众数
方差
甲公司
6
6
乙公司
4
(1)填空:_____,______;
(2)求出乙公司的平均月收入以及方差;()
(3)小明的叔叔计划从两家公司中选择一家做网约车司机,如果你是小明,你建议他选择哪家公司?请说明理由.
25.空气质量指数(Air Quality Index,缩写AQI)是定量描述空气状况的非线性无量纲指数.其数值越大、级别和类别越高,说明空气污染状况越严重,对人体的健康危害也就越大,适用于表示某地区的短期空气质量状况和变化趋势.(空气污染指数为0~50是优;空气污染指数为50~100是良好;空气污染指数为100~150是轻度污染;空气污染指数为150~200是中度污染;空气污染指数为200~250是重度污染.)
如图表示的是某地区2022年11月份30天日均AQI指数的频率分布直方图.
空气质量指数(AQI)
0~50
50~100
100~150
150~200
200~250
天数
3
3
3
频率
0.1
0.1
0.1
(注:每组数据可含最高值,不含最低值)
(1)请你根据上述频率分布直方图及表格完成下面的填空:
这个地区11月份空气为轻度污染的天数是________天.________;________;________;________.
(2)为了进一步改善生活环境和空气质量,提高人民的生活质量,当地政府计划从2023年开始增加绿化面积.已知2022年底该地区的绿化面积为20万亩,如果到2024年底,该地区的绿化面积比为2022年的绿化面积增加了50%,假设这两年绿化面积的年增长率相同,求这两年中绿化面积每年的增长率(精确到0.01)(参考数据:,,,)
2 / 17
学科网(北京)股份有限公司
$