内容正文:
9.2 用样本估计总体
9.2.1 总体取值规律的估计
学习目标
1.掌握频率分布表的作法以及频率分布直方图的画法. 2.掌握用频率分布直方图估计总体. 3.能根据频率分布表和频率分布直方图观测数据的分布规律.
新知学习 探究
新课导学
某高校拟研究有关体育赛事赞助的消费者理论.经学校批准,校园媒体针对“你会因为企业赞助,而更加关注该企业吗”这一问题进行问卷调查.通过对1 000人进行调查,得到以下数据:76人格外关注,284人关注,465人一般,175人不关注.
思考 如果你是高校记者,你会怎样整理这些数据?
提示:先对数据进行处理,再作扇形图.
态度
格外关注
关注
一般
不关注
人数
76
284
465
175
所占比例
一 频率分布概念的理解
【即时练】
1.(多选)肥胖不仅影响个人形象,还会增加各种疾病发生的概率,近几年,减肥行业风生水起.为了了解运动健身减肥的效果,某健身房跟踪调查了20名肥胖者,把他们健身前后的体重(单位:)制成如下表格.
调查日期
2024年2月1日
体重区间
频率
0
0.3
0.5
0.2
调查日期
2025年2月1日
体重区间
频率
0.1
0.4
0.5
0
对比健身前后,关于这20名肥胖者,下面结论正确的是( )
A. 健身后,体重在区间内的频数增加值为2
B. 健身后,原来体重在区间内的肥胖者体重都有减少
C. 原来体重在和内的人减肥失败
D. 原来体重在区间内的人减肥没有效果
【答案】AB
【解析】选.健身前后,体重在区间 内的频数分别为,,增加值为2,A正确;健身前后,体重在区间 内的频数分别为,,说明此前体重在该区间的肥胖者体重都有减少,B正确;体重在 内的频数没有变化,但健身前后的人不一定相同,D错误;同理C错误.
2.[2024·四川成都期末]一个频率分布表(样本容量为30)不小心被损坏了一部分,只记得样本中数据在内的频率为,则估计样本在内的数据个数共为( )
分组
频数
3
4
5
A. 14 B. 15 C. 16 D. 17
【答案】B
【解析】选B.因为样本中数据在 内的频率为,样本容量为30,所以样本数据在 内的频数为,所以样本在 内的数据个数共为.
频率反映了相对总体而言的相对强度,其携带的总体信息要超过频数,频数受总体数量的影响较大,所以频率能客观地反映总体分布,在生活中,常用样本的频率分布去估计总体的频率分布.
二 频率分布直方图
角度1 绘制频率分布直方图
绘制频率分布直方图的步骤
【答案】差; ; 样本量; 1; 1
例1 某市今年4月对空气质量指数的监测数据如下.
61
88
82
(1) 制作频率分布表,并绘制频率分布直方图;
(2) 根据国家标准,空气质量指数在内,空气质量为优,在内,空气质量为良,在内,空气质量为轻度污染,在内,空气质量为中度污染.请对该市的空气质量给出一个简短的评价.
【答案】
(1) 【解】分析所给数据,可知最小值为45,最大值为103,考虑以10为组距进行分组,分为7组:
,,,.
频率分布表如下:
分组
频数
频率
2
1
4
6
10
5
2
频率分布直方图如下:
(2) 写出一条满足题意的评价即可,比如:①该市一个月中有2天空气质量为优,占当月天数的;有26天空气质量为良,占当月天数的.空气质量为优或良的天数共有28天,占当月天数的,说明该市空气质量基本良好.②该市一个月中轻度污染有2天,占当月天数的.空气质量指数在 内(接近轻度污染)的天数有15天,加上轻度污染的天数,共有17天,占当月天数的,超过,说明该市空气质量有待进一步改善.
(1)在列频率分布表时,极差、组距、组数有如下关系:
①若是整数,则组数;
②若不是整数,则的整数部分组数.
(2)绘图时,应以横轴表示分组,纵轴表示各组频率与组距的比值,以各个组距为底,以各组频率除以组距的商为高,分别画成小长方形,便得到频率分布直方图.
角度2 频率分布直方图中的计算问题
例2
(1) (多选)某学校为了调查学生一周在生活方面的支出情况,抽取了一个容量为的样本,其频率分布直方图如图所示,其中支出在内的学生有60人,则下列说法正确的是( )
A. 样本中支出在内的频率为
B. 样本中支出不少于40元的人数为132
C. 的值为200
D. 若该校有2 000名学生,则约有600人支出在内
(2) 从某小学随机抽取100名学生,将他们的身高(单位:)数据绘制成频率分布直方图(如图所示),由图中数据可知______(保留3位小数).若要从身高在,这三组内的学生中,用分层随机抽样的方法选取18名学生参加一项活动,则从身高在内的学生中抽取的学生人数为______.
【答案】(1) BCD
(2) 0.030;3
【解析】
(1) 设 对应小长方形的高为,,解得,所以样本中支出在 内的频率为,A选项错误;,C选项正确;样本中支出不少于40元的人数为,B选项正确;若该校有2 000名学生,则约有 人支出在 内,D选项正确.故选.
(2) 易知,解得.由题中的频率分布直方图可知,身高在,,这三组内的学生总人数为,其中身高在 内的学生人数为,所以从身高在 内的学生中抽取的学生人数为.
频率分布直方图中的计算问题
(1)小长方形的面积组距频率;
(2)各小长方形的面积的总和等于1;
(3)频率,此关系式的变形为样本量,样本量×频率频数.
[跟踪训练1].某车站在春运期间为了了解旅客购票用时情况,用随机抽样的方法调查了名旅客从开始在售票窗口排队到购到车票所用的时间(以下简称为购票用时,单位为),下面是这次调查统计分析得到的频率分布表和频率分布直方图.
分组
频数
频率
0
0
10
0.10
10
②
①
0.50
30
0.30
合计
1.00
解答下列问题:
(1) 求这次抽样的样本量;
(2) 写出表中①②表示的数据并补全频率分布直方图;
(3) 旅客购票用时的平均数可能落在哪一组?
【答案】(1) 解:样本量.
(2) ;;所补频率分布直方图如图中的阴影部分所示.
(3) 设旅客平均购票用时为,则有
,
即.
所以旅客购票用时的平均数可能落在第四组中.
三 其他几类常用统计图
类别
条形图
折线图
扇形图
特点
一般地,条形图中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,条形图中每一个长方形都是等宽的
用一个单位长度表示一定的数量,用折线的起伏表示数量的增减变化
用整个圆表示总体,扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比
作用及选用情境
能清楚地表示每个项目的具体数量,便于相互比较大小
能清楚地看出数量增减变化的情况及各部分数量的多少.常用来表示随时间变化的数据,当然,也可以用在其他合适的情形中
可以形象地表示出各部分数据在全部数据中所占的比例情况
例3
(1) (对接教材例1)某中学组织三个年级的学生进行党史知识竞赛.经统计,得到前200名学生分布的扇形图(如图1)和前200名中高一学生排名分布的频率条形图(如图2),则下列结论错误的是( )
A. 成绩在前200名的学生中,高一人数比高二人数多30
B. 成绩在第名的学生中,高三最多有32人
C. 高一学生的成绩在第名的人数一定比高三学生的成绩在第名的人数多
D. 成绩在第名的学生中,高二人数可能比高一人数多
(2) (多选)统计某商城一年中各月份的收入和支出(单位:万元)情况,并制作折线图如图所示,则下列说法错误的是( )
A. 利润最高的月份是2月份(注:利润收入-支出)
B. 7月份至9月份的月平均支出为50万元
C. 支出的最高值与最低值之比是
D. 2月份至3月份的收入的变化量与11月份至12月份的收入的变化量相同
【答案】(1) D
(2) ABC
【解析】
(1) 由题图1可知,成绩在前200名的学生中,高一人数比高二人数多,A正确;成绩在第 名的学生中,高一人数为,因此高三最多有32人,B正确;由题图2知高一学生的成绩在第 名的人数为,而高三学生的成绩在第 名的人数最多为32,故高一学生的成绩在第 名的人数一定比高三学生的成绩在第 名的人数多,C正确;成绩在第 名的学生中,高一人数为,高二学生的成绩在第 名的人数最多为23,即成绩在第 名的学生中,高一的人数一定比高二的人数多,D错误.故选D.
(2) 对于A,由题图可得 月份的利润分别为20万元,20万元,30万元,20万元,20万元,20万元,20万元,10万元,20万元,30万元,20万元,20万元,所以利润最高的月份为3月份和10月份,所以A说法错误;对于B,7月份至9月份的月平均支出为 万元,所以B说法错误;对于C,由题图可知最高的支出为60万元,最低的支出为10万元,所以支出的最高值与最低值之比是,所以C说法错误;对于D,由题图可知2月份至3月份的收入减少了20万元,11月份至12月份的收入也减少了20万元,所以2月份至3月份的收入的变化量与11月份至12月份的收入的变化量相同,所以D说法正确.故选.
综合应用统计图解决问题的思路
条形图可以直观地表示各个项目的具体数量,扇形图能够清晰地显示各个项目占总体的百分比,折线图反映数据升降趋势.解决统计类问题时常需将各种统计图结合,不能孤立分开.
[跟踪训练2].
(1) (多选)如图是某民航部门统计的某年春运期间十二个城市售出的往返机票的平均价格以及相比去年同期变化幅度的数据统计图.下列结论正确的是( )
A. 深圳的变化幅度最小,北京的平均价格最高
B. 深圳和厦门往返机票的平均价格同去年相比有所下降
C. 平均价格从高到低位于前三位的城市为北京、深圳、广州
D. 平均价格的涨幅从高到低位于前三位的城市为天津、西安、上海
(2) 如图是根据某中学为灾区捐款的情况而制作的统计图,已知该校在校学生3 000人,根据统计图计算该校学生共捐款________元.
【答案】(1) ABC
(2) 37 770
【解析】
(1) 选.依题意,变化幅度看题中的折线图,越接近零轴变化幅度越小,越远离零轴变化幅度越大,位于零轴下方者表明价格下降,位于零轴上方者表明价格上涨;平均价格看题中的条形图,条形图越高其平均价格越高.由题图知A,B,C都正确,D错误.故选.
(2) 由题图,得高一人数为,捐款数是(元);高二人数为,捐款数是(元);高三人数为,捐款数是(元).所以该校学生共捐款(元).
课堂巩固 自测
1.[2024·广东广州阶段练习]要调查某地区高中学生身体素质,从高中生中抽取100人进行跳远测试,根据测试成绩制作频率分布直方图如下图,现再从这100人中用分层随机抽样的方法抽取20人,应从[120,130)间抽取人数为,则为( )
A. 4 B. 5 C. 6 D. 7
【答案】C
【解析】选C.由题得,所以.
在 之间的学生有(人),现再从这100人中用分层随机抽样的方法抽取20人,
应从 间抽取人数为,故.
2.某校在一个学期的开支如图1所示,在该学期的水、电、交通开支(单位:万元)如图2所示,则该学期的水、电开支占总开支的百分比为( )
A. B. C. D.
【答案】B
【解析】选B.由题图2,知水、电开支占水、电、交通开支的比例为.由题图1,知水、电、交通开支占总开支的比例为,因此,该学期的水、电开支占总开支的百分比为,故选B.
3.(教材P202T1改编)根据某网站统计的某市6月份30天的空气质量指数,将数据整理得到如下表,将表中空格补充完整.
空气质量指数
频数
______
8
14
________
频率
________
______
________
【答案】6; ; ; 2;
【解析】由题知,空气质量指数落在 内的频数为,所以空气质量指数落在 内的频数为,频率为,落在 内的频率为,落在 内的频率为,表格补充如下:
空气质量指数
频数
6
8
14
2
频率
4.(教材P198T1改编)从某校高三学生中抽取50名参加数学竞赛,成绩分组(单位:分)及各组的频数如下:
,2;,3;,10;
,15;,12;,8.
(1) 列出样本的频率分布表;
(2) 画出频率分布直方图;
(3) 估计成绩在分的学生比例.
【答案】
(1) 解:频率分布表如下:
成绩分组
频数
频率
2
0.04
0.004
3
0.06
0.006
10
0.20
0.020
15
0.30
0.030
12
0.24
0.024
8
0.16
0.016
合计
50
1.00
0.100
(2) 频率分布直方图如图所示.
(3) 学生成绩在 分的频率为,所以估计成绩在 分的学生比例为.
1.已学习:频率分布直方图的绘制及应用、常见统计图及应用.
2.须贯通:(1)频率分布直方图是通过各小组数据在样本量中所占比例大小来表示数据的分布规律,直观显示了样本数据的频率分布情况;
(2)扇形图、条形图与折线图在表示数据上有不同的特点,在解决问题的过程中,根据实际问题的特点,选择恰当的统计图对数据进行可视化的描述.
3.应注意:(1)频率分布直方图中小长方形的高及面积的意义;
(2)统计表中的数据代表的实际意义.
学科网(北京)股份有限公司
$