内容正文:
5.1.4 用样本估计总体 [教学方式:拓展融通课——习题讲评式教学]
[课时目标]
1.本课时的重点是正确理解样本数据标准差的意义和作用,学会计算数据的标准差.
2.本课时的难点是能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.
用样本的分布估计总体的分布
(1)一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大.
(2)在容许一定误差存在的前提下,可以用样本的数字特征去估计总体的数字特征.
(3)分层抽样的平均数、方差
以分两层抽样的情况为例.假设第一层抽取m个数,分别为x1,x2,…,xm,平均数为,方差为s2;第二层抽取n个数,分别为y1,y2,…,yn,平均数为,方差为t2.如果记样本均值为,样本方差为b2,则,
b2==.
题型(一) 用样本的数字特征估计总体的数字特征
[例1] 甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示:
(1)填写下表;
平均数
方差
中位数
命中9环及以上
甲
7
1.2
1
乙
5.4
3
(2)请从四个不同的角度对这次测试进行分析:
①从平均数和方差结合分析偏离程度;
②从平均数和中位数结合分析谁的成绩好些;
③从平均数和命中9环及以上的次数相结合看谁的成绩好些;
④从折线图上两人射击命中环数及走势分析谁更有潜力.
解:(1)由题图,得乙的打靶环数依次为2,4,6,8,7,7,8,9,9,10,所以=×(2+4+6+8+7+7+8+9+9+10)=7;乙的打靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是=7.5;甲的打靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示:
平均数
方差
中位数
命中9环及以上
甲
7
1.2
7
1
乙
7
5.4
7.5
3
(2)①甲、乙的平均数相同,均为7,但<,说明甲偏离平均数的程度小,而乙偏离平均数的程度大.
②甲、乙的平均水平相同,而乙的中位数比甲大,说明乙打靶成绩比甲好.
③甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的打靶成绩比甲好.
④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.
|思|维|建|模|
在日常生活中,当面对一组数据时,相比每一个观测值,有时我们更关心的是能反映这组数据特征的一些值,如本例,我们可以从平均数、中位数、百分位数、众数、极差、方差、标准差等角度进行比较.
[针对训练]
1.某汽车租赁公司为了调查A型汽车与B型汽车的出租情况,现随机抽取这两种型号的汽车各50辆,分别统计了每辆汽车在2023年11月22日至11月28日的出租天数,统计数据如下表:
A型汽车
出租天数
3
4
5
6
7
车辆数
3
30
5
7
5
B型汽车
出租天数
3
4
5
6
7
车辆数
10
10
15
10
5
(1)试根据上面的统计数据,判断这两种型号的汽车在2023年11月22日至11月28日出租天数的方差的大小关系;
(2)如果A型汽车与B型汽车每辆车每天出租获得的利润相同,该公司需要购买一辆汽车,请你根据所学的统计知识,给出建议应该购买哪一种车,并说明你的理由.
解:(1)由题表,得50辆A型汽车出租天数的平均数为=×(3×3+4×30+5×5+6×7+7×5)=4.62.
∴=×[(3-4.62)2×3+(4-4.62)2×30+(5-4.62)2×5+(6-4.62)2×7+(7-4.62)2×5]=1.235 6.
50辆B型汽车出租天数的平均数为=×(3×10+4×10+5×15+6×10+7×5)=4.8.
∴=×[(3-4.8)2×10+(4-4.8)2×10+(5-4.8)2×15+(6-4.8)2×10+(7-4.8)2×5]=1.56.
∴B型汽车在2023年11月22日至11月28日出租天数的方差较大.
(2)答案一:∵A型汽车在2023年11月22日至11月28日出租天数的平均数为4.62,B型汽车在2023年11月22日至11月28日出租天数的平均数为4.8,
∴选择B型汽车的利润较大.故应该购买B型汽车.
答案二:∵A型汽车在2023年11月22日至11月28日出租天数的平均数为4.62,B型汽车在2023年11月22日至11月28日出租天数的平均数为4.8,但B型汽车出租天数的方差较大,利润不稳定.
∴应购买A型汽车.(答出一个即可)
题型(二) 分层抽样的平均数、方差
[例2] 在对某中学高一年级学生身高的调查中,采用样本容量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62.你能由这些数据计算出总样本的方差,并对高一年级全体学生的身高方差作出估计吗?(保留小数点后两位有效数字)
解:把男生样本记为x1,x2,…,x23,其平均数记为,方差记为;把女生样本记为y1,y2,…,y27,其平均数记为,方差记为;把总样本数据的平均数记为,方差记为s2.
由=170.6,=160.6,根据按比例分配分层随机抽样总样本平均数与各层样本平均数的关系,可得总样本平均数为=+==165.2.把已知的男生、女生样本平均数和方差的取值代入,可得s2=≈51.49.我们可以计算出总样本的方差约为51.49,并据此估计高一年级学生身高的总体方差约为51.49.
|思|维|建|模|
求分层抽样方差的方法
(1)弄清楚各层中的样本容量、平均数、方差;
(2)代入方差公式b2=.
[针对训练]
2.某学校有高中学生500人,其中男生320人,女生180人.有人为了获得该校全体高中学生的身高信息,采用分层抽样的方法抽取样本,并观测样本的指标值(单位:cm),计算得男生样本的均值为173.5,方差为17,女生样本的均值为163.83,方差为30.03.
根据以上信息,能够计算出总样本的平均数和方差吗?(保留小数点后两位有效数字)
解:记总样本的平均数为,方差为,则
=×(320×173.5+180×163.83)≈170.02.
=≈43.24.故总样本的平均数约为170.02,方差约为43.24.
题型(三) 用样本的分布估计总体的分布
[例3] 某超市有甲、乙两家分店,为调查两家分店的销售情况,现随机抽查了上个年度两家店20天的日销售额(单位:万元),分别得到甲、乙两家分店日销售额的频率分布直方图如下:
(1)比较甲、乙两店日销售额的平均数的大小(同一组中的数据用该组区间的中点值作代表);
(2)若规定分店一年(按360天计算)中日销售额不低于55万的天数不少于120天为运转良好,请结合上图,分析两家分店上个年度运转是否良好?
(3)如果你是投资决策者,你更愿意在哪家店投资,请你根据所学的统计知识,说明你的理由.
解:(1)由题图估算甲店的日销售额平均数为
=10×0.1+30×0.1+50×0.6+70×0.15+90×0.05=49,
估算乙店的日销售额平均数为
=10×0.2+30×0.25+50×0.25+70×0.1+90×0.2=47.
>.
(2)由题意,得日销售额不低于55万的天数占比不少于=.
甲店日销售额不低于55万的频率约为(60-55)×0.03+20×0.007 5+20×0.002 5=0.35,
乙店日销售额不低于55万的频率约为(60-55)×0.012 5+20×0.005+20×0.010=0.362 5,
两者均大于,两店均运转良好.
(3)答案一:甲店日销售额平均值略高于乙店,由频率分布直方图可知.甲店的销售额方差明显低于乙店,故甲店销售情况比乙店要稳定,所以我选甲店.
答案二:虽然甲店日销售额平均值略高于乙店,但乙店日销售额在80万~100万出现的频率比甲店高,故我认为乙店更有潜力,所以我选乙店.(答出一个即可)
|思|维|建|模|
利用频率分布直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能比较准确的估计其众数、中位数和平均数.
[针对训练]
3.某快递公司招聘快递骑手,该公司提供了两种日工资方案:方案1:规定每日底薪50元,快递骑手每完成一单业务提成3元;方案2:规定每日底薪150元,快递业务的前44单没有提成,从第45单开始,每完成一单业务提成5元,该快递公司记录了每天骑手的人均业务量.现随机抽取100天的数据,将样本数据分为[25,35),[35,45),[45,55),[55,65),[65,75),[75,85),[85,95]七组,整理得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
(2)若仅从人均日收入的角度考虑,请你利用所学的统计学知识为新聘骑手做出日工资方案的选择,并说明理由(同组中的每个数据用该组区间的中点值代替).
解:(1)由频率分布直方图得(0.005+0.005+a+0.03+a+0.015+0.005)×10=1,解得a=0.02.
(2)由题图 ,知快递公司人均每日完成快递数量的平均数是30×0.05+40×0.05+50×0.2+60×0.3+70×0.2+80×0.15+90×0.05=62.
方案1日工资为50+62×3=236,
方案2日工资为150+(62-44)×5=240>236.
∴骑手应选择方案2.
学科网(北京)股份有限公司
$