内容正文:
第二十四章 数据的分析 大单元教学设计
大单元主题背景分析(教材分析)
教材地位与作用
本单元属于初中数学统计与概率核心板块,承接七年级下册《数据的收集、整理与描述》,是初中统计知识体系的深化收尾章节,起到承前启后的关键作用。前序学生仅学会制表、绘图描述数据,本章首次引入定量统计量,从集中趋势、波动程度双维度量化解读数据,完成“收集—整理—描述—分析—推断”完整统计闭环。单元内容分为三大模块:平均数(加权平均数)、中位数与众数刻画数据集中趋势;极差、方差刻画数据离散波动;课题学习《体质健康测试中的数据分析》开展完整统计实践活动。本章是中考统计大题必考内容,同时为高中统计、抽样推断奠定基础,兼具工具性与实践价值,是培养学生数据素养的核心载体,关联生活测评、评比、方案选择、质量检测等真实场景。
新课标衔接与核心素养
· 数据观念(核心):经历完整统计活动,理解平均数、中位数、众数、方差的统计意义,能依托样本数据推断总体,学会用数据支撑判断与决策,形成用数据说话的理性思维。
· 运算能力:熟练完成加权平均数、方差的列式计算,规范权重、偏差平方的运算步骤,提升含分数、平方的综合运算准确度。
· 逻辑推理:对比不同统计量适用场景,辨析集中趋势与波动程度的关联,结合数据特征合理选择统计量分析问题,发展归纳、比较推理能力。
· 模型观念:将成绩测评、产品检测、体质调查等现实情境抽象为数据分析模型,借助统计量解决评比、选拔、质量评估类实际问题。新课标强调弱化机械计算,强化统计量实际意义解读与完整统计实践,落实跨学科实践要求,依托体质健康课题实现数学与体育、健康教育融合育人。
学情分析
· 已有基础:学生七年级已掌握条形图、折线图、直方图等数据整理工具,会简单算术平均数计算,具备基础数据收集、图表读取能力;能读懂生活中成绩、销量、测评类数据,有初步生活统计感知。
· 认知短板①概念混淆:分不清加权平均数权重、中位数与众数适用场景,认为平均数万能,忽略极端值对平均数的干扰;②意义脱节:只会机械套公式计算方差,不理解方差大小代表数据稳定程度,不会结合波动做决策;③实践薄弱:缺乏完整统计活动经验,不会自主设计调查、整理数据、综合多类统计量分析结论;④审题疏漏:加权平均数易遗漏权重,方差计算漏乘数据个数,实际问题不会结合背景取舍统计量。
· 心理特点:八年级学生对调查、测评类实践活动兴趣较高,但繁琐方差计算易产生畏难情绪;学生习惯单一数值计算,不习惯多角度对比分析数据,容易出现“会算不会解读、会做题不会说理”的分化现象。
单元教学目标
知识与技能
· 理解算术平均数、加权平均数概念,掌握权重含义,熟练计算两类平均数,能区分二者适用场景。
· 掌握中位数、众数定义,会根据一组数据求解中位数与众数,辨析三种集中趋势统计量的优缺点与适用条件。
· 理解极差、方差的统计意义,熟练计算方差,能根据方差大小判断数据波动、稳定程度。
· 能综合运用平均数、中位数、众数、方差多角度分析数据,完成评比、选拔、质量评估类应用题。
· 独立完成完整统计实践活动:设计调查方案、收集整理数据、计算统计量、绘制图表、撰写数据分析报告。
数学思考
· 经历“观察数据—计算统计量—对比特征—分析推断”全过程,体会量化分析、分类对比、样本估计总体统计核心思想。
· 通过辨析四类统计量差异,建立多角度、辩证看待数据的思维,理解单一统计量无法完整刻画数据全貌。
· 在方差公式推导、加权平均数权重分析中,感受代数运算服务数据分析的内在联系,打通代数运算与统计应用壁垒。
问题解决
· 能从成绩、体育测评、产品检测、薪资调查等真实情境提取数据,选用合适统计量定量分析,给出合理决策建议。
· 能独立处理含权重、极端值、多组对比的统计综合题,规范书写计算步骤与数据分析说理过程。
· 小组合作完成体质健康等课题实践,自主排查数据收集、计算、分析中的错误,归纳统计类问题通用解题流程。
情感态度
· 通过生活统计案例、校园体质调查实践,感受数据分析的实用价值,体会“用数据理性判断”的科学精神。
· 在统计量对比辨析、小组调查报告展示中,养成严谨求实、客观公正、全面看待问题的学习品质。
· 依托体质健康调查,关注自身身心健康,结合薪资、测评数据客观看待社会现象,落实立德树人,培育理性思辨的公民素养。
学习活动设计
数据的集中趋势与离散程度活动一
数据的四分位数与分组活动二
学习评价设计
过程性评价
课堂探究表现(20%):评价维度:统计量概念发言、加权/方差计算板书、数据对比说理、小组调查分工参与度。重点观测学生能否解释统计量实际意义,而非仅算出结果,鼓励多角度表达数据分析观点。
分层作业与错题评价(25%):基础作业核查平均数、方差计算准确率;变式作业侧重统计量辨析、极端值问题;拓展作业为多维度数据分析应用题。要求整理“统计量适用场景、方差计算、权重易错点”专属错题集,评价错题归因与反思完整性。
实践课题评价(15%):针对体质健康数据分析实践,从调查方案设计、数据整理规范度、统计量综合运用、报告完整度四维度打分,重视学生实践操作与成果表达。
终结性评价
单元综合测试分层命题,贴合中考统计命题逻辑:
基础层70%:单一统计量计算、概念辨析、简单图表读数,保障全员掌握必备知识;
提升层20%:加权平均数、极端值影响、两组数据综合对比分析,考查知识灵活迁移;
素养层10%:完整统计情境应用题、实践数据分析说理题,重点考核数据观念、模型观念核心素养。
反思性教学改进
(一)传统教学现存核心问题
· 重计算、轻意义,数据观念虚化:以往课堂侧重公式刷题,只训练平均数、方差计算,忽略统计量现实意义解读,学生只会算数,遇到“选用哪种统计量说理”题型无从下手,未形成数据分析思维。
· 知识碎片化,缺乏整体统计闭环:分课时孤立讲授平均数、中位数、方差,未串联“集中趋势+波动程度”双维度分析逻辑,学生割裂看待各类统计量,不会综合多指标评价一组数据。
· 实践教学流于形式,项目学习弱化:课题学习仅简单讲解,未组织学生实地调查、自主完成完整统计流程,学生缺少真实数据处理体验,无法理解样本估计总体的统计本质。
· 分层落实不足,两极分化加剧:方差计算繁琐,统一习题导致学困生计算出错频繁、产生畏难情绪;优等生重复基础计算,缺少综合分析、实践探究类拓展任务。
· 脱离真实情境,建模能力薄弱:例题多为纯数字习题,缺少校园、生活、社会真实调查情境,学生难以将现实问题转化为数据分析模型,不会依托数据给出合理决策。
(二)适配2022年新课标针对性教学改进策略
· 意义为先,重构统计探究课堂:摒弃直接灌输公式模式,以真实数据情境导入,先引导学生感知“为什么需要这个统计量”,再推导计算方法。每道计算题配套“数据解读说理”设问,强制学生结合背景解释统计量含义,落地数据观念素养。
· 大单元整合教学,构建完整统计框架:单元开篇绘制统计知识思维导图,贯穿“集中趋势—波动程度—综合分析”主线,增设一节专题对比课,横向辨析四类统计量优缺点,教会学生双维度综合解读数据,打通碎片化知识壁垒。
· 做实课题实践,落实完整统计活动:预留完整课时开展体质健康实地调查,让学生自主分工收集、整理、计算、绘图、撰写分析报告,完整经历统计全流程,体会样本推断总体的统计思想,强化实践应用能力。
· 全流程分层设计,化解计算畏难:实施分层任务、分层作业、分层提问:学困生简化方差计算步骤、侧重概念理解;中等生完成常规计算与辨析;优等生开展多组数据对比、自主设计调查;课堂设置小组互助计算,降低繁琐运算心理压力。
· 情境常态化,强化统计建模能力:选用班级成绩、体育测试、商品销量、薪资调查等贴近学生生活的素材创设例题,固定“提取数据—选统计量—计算—解读决策”标准化解题流程,训练学生从现实情境中建立数据分析模型。
(三)长效后续教学优化方向
· 联动七年级数据收集整理知识、九年级概率内容,构建完整初中统计知识体系,强化样本、总体、随机的连贯认知。
· 常态化开展小型跨学科统计实践(结合体育、道法、生物学科调查),落实新课标跨学科学习要求,拓宽数据分析应用场景。
· 增设统计说理专项训练,规范数据分析答题语言,聚焦中考统计大题评价类题型,全面培育学生数据观念、理性决策能力,达成新课标核心素养育人目标。
单元教学结构图
教学设计
数据的集中趋势与离散程度活动一
· 情境引入
甲、乙两组同学的跳绳成绩(单位:次/min)如下:
你认为哪组的跳绳成绩更好?
为了便于比较,需要分别把每组数据汇总到一个数值.对于以上问题,可以用每组跳绳成绩的平均数进行比较.
甲组跳绳成绩的平均数为182+194+143+185+156/5=172;
乙组跳绳成绩的平均数为199+148+242+170+141/5=180;
由于乙组的跳绳成绩的平均数大于甲组的,所以乙组的跳绳成绩更好.
思考:是否可以用每组跳绳成绩的总数比较两组跳绳成绩?如果两组人数不同呢?
师生活动:教师出示甲乙两组跳绳成绩表格,抛出 “哪组成绩更好” 的核心问题,让学生独立计算两组平均分,对比数值初步得出结论。随后追加追问:仅依靠平均数判断是否全面?学生分组交流讨论,发现平均数无法体现数据分布情况。教师顺势引导学生观察个人成绩在两组中的排位,制造认知冲突,引出仅靠单一统计量存在局限,自然导入本节课集中趋势与离散程度的学习内容。
设计意图:选用学生熟悉的跳绳测评素材创设真实情境,贴合校园生活,降低统计知识的陌生感。通过平均分计算搭建已有知识基础,再借助排位对比制造认知矛盾,让学生直观感知单一平均数的局限性,激发探究多种统计量的内在需求。落实2022新课标数据观念素养,让学生初步建立多角度、辩证分析数据的统计思维,为本节课新知探究做好铺垫。
· 探究新知
某广告公司欲招聘广告策划人员一名,对A,B,C三名候选人进行了三项素质测试,他们的各项测试成绩如下表所示:
(1)如果根据三项测试的平均成绩决定录用人选,那么谁将被录用?
解:(1)A的平均成绩为1/3×(72+50+88)=70(分).
B的平均成绩为1/3×(85+74+45)=68(分).
C的平均成绩为1/3×(67+70+67)=68(分).因此候选人A将被录用.
(2)根据实际需要,公司将创新、综合知识和语言三项测试得分按4:3:1的比例确定各人测试成绩,此时谁将被录用?
解:(2)A的测试成绩为72×4+50×3+88×1/4+3+1=65.75(分).
B的测试成绩为85×4+74×3+45×1/4+3+1=75.875(分).
C的测试成绩为67×4+70×3+67×1/4+3+1=68.125(分).因此候选人B将被录用.
思考:同样是算平均成绩,为什么会出现不同的结果?
数据的权能够反映数据的相对重要程度!
同样一张应试者的应聘成绩单,由于各个数据所赋的权数不同,造成的录取结果截然不同.
因为测试项目的重要程度不一样!
思考:某天访问A,B两个新闻类网站的用户数分别为3×10⁷和1×10⁷,下表是用户在每个网站的停留时间和关于军事话题调查的统计结果.
这天两个网站所有用户停留时间的平均数和对军事话题感兴趣的百分比分别是多少?
由于访问两个网站的用户数不同,两个网站所有用户停留时间的平均数不能是两个网站各自用户平均停留时间的平均数0.5+0.7/2,还应考虑访问网站用户数的影响.两个网站所有用户对军事话题感兴趣的百分比的计算也类似.
解:(1)根据平均数和总数的关系,可以计算出两个网站所有用户停留时间的平均数为0.5×3×10^7+0.7×1×10^7/3×10^7+1×10^7==0.5×3/4+0.7×1/4=0.55.
解:(2)两个网站所有用户对军事话题感兴趣的百分比为24%×3×10^7+32%×1×10^7/3×10^7+1×10^7==24%×3/4+32%×1/4=26%.
可以发现,计算分组(两组或更多组)数据的平均数或百分数,只需知道两类信息:一是每组数据的平均数或百分数,二是每组数据的个数(频数),或每组数据个数所占的比值(频率).根据这两类信息,以频数或频率为权,通过计算加权平均数就可以得到结果.
上述计算分组数据的平均数或百分数的方法在实际中有着重要应用.例如,要计算全国的居民人均可支配收入,可先按省份各自计算其人均可支配收入和人数,再利用加权平均数进行计算.这样不仅减少了把各省份所有调查的数据集中在一起的工作,而且分散了计算量.像这样先按数据分组分别计算,再通过一定算法由各组结果计算出最后结果的方法属于分布式计算.在大数据时代,数据规模非常巨大,在应用中往往对计算的时效性又有很高要求,利用分布式计算不仅可以节约整体计算时间,提高计算效率,还可以减少大量数据传输和存储带来的时间、经济成本.
我们知道,当要考察的对象很多或考察本身带有破坏性时,统计学中常常使用样本数据的代表意义估计总体的方法来获得对总体的认识.
例如,实际生活中经常用样本的平均数来估计总体的平均数.
情境引入中,计算得到甲和乙两组跳绳成绩的平均数分别为172次/min和180次/min.张华个人的跳绳成绩为175次/min,她认为自己的成绩在甲组中属于中上水平,在乙组中属于中下水平.你认可张华的说法吗?
按从小到大的顺序分别排列两组跳绳成绩,甲组为
143 156 182 185 194
处在中间位置的数是182,它的左侧和右侧各有2个数.乙组为
141 148 170 199 242
处在中间位置的数是170,它的左侧和右侧各有2个数.
张华的跳绳成绩要处于一个组的中上(或中下)水平,意味着她的成绩超过(或低于)这个组至少一半人数的成绩,即超过(或低于)这个组中成绩排名居中的人的成绩.
张华的个人跳绳成绩175小于甲组中间位置的数182,而大于乙组中间位置的数170,因此她的成绩在甲组中处于中下水平,在乙组中处于中上水平,这与她自己作出的判断正好相反.
归纳总结:将一组数据按照由小到大(或由大到小)的顺序排列:
如果数据的个数是奇数,则称处于中间位置的数为这组数据的中位数;
如果数据的个数是偶数,则称中间两个数据的平均数为这组数据的中位数.
归纳总结:求中位数的步骤
首先将数据按照由小到大(或由大到小)的顺序排列;
然后数清数据个数是奇数还是偶数,如果数据个数为奇数,则取中间的数作为中位数,如果数据的个数为偶数,则取中间位置两数的平均值作为中位数.
一组数据按大小排序后,位于中位数左、右两侧的数据个数相同,因此中位数反映了一组数据取值的中间水平.
一组数据的中位数是唯一的,中位数的优势在于受极端值的影响较小,故当一组数据中的个别数据的变化较大时,可用中位数描述其平均水平,中位数的缺点在于不能充分利用各数据的信息.
归纳总结:中位数的特征及意义
1.中位数是一个位置代表值(中间数),它是唯一的.
2.如果一组数据中有极端数据,中位数能比平均数更合理地反映该组数据的整体水平.
3.如果已知一组数据的中位数,那么可以知道,小于或大于这个中位数的数据各占一半,反映一组数据的中间水平.
思考:班级春游有三个备选地点,经全班一人一票投票,每个地点的得票数如右表所示.
你认为班级的春游地点应该选择哪里?
提示:全班一人一票投票,相当于对全班同学作了一次全面调查,收集到的是每位同学的投票结果(北京故宫、颐和园或香山公园),在统计中这也属于数据.与前面见到的数据都是数值不同,这里的数据无法进行计算或排序,因此无法通过求它们的平均数或中位数去刻画班级的集体意见.对于这种情况,一般我们会采取少数服从多数的原则,把得票数最多的地点作为班级的集体意见.由表可知,颐和园得票数最多,可以把颐和园作为全班同学意见的代表.
一般地,把一组数据中出现次数最多的那个数据叫做众数.
如果一组数据中有两个或两个以上的数据出现的次数并列最多,那么把这几个数据都作为这组数据的众数;如果一组数据中没有出现相同的数据,那么就认为这组数据没有众数.众数也是刻画数据集中趋势的一种统计量,当一组数据有较多的重复数据时,众数往往能较好地反映其集中趋势.
注意:
(1)一组数据的众数一定出现在这组数据中.
(2)一组数据的众数可能不止一个.如1,1,2,3,3,5中众数是1和3.
(3)众数是一组数据中出现次数最多的数据而不是数据出现的次数,
如1,1,1,2,2,5中众数是1而不是3.
某大商场策划了一次“还利给顾客”活动,凡一次购物100元以上(含100元)均可当场抽奖.奖金分配见下表:
思考:商场欺骗顾客了吗?
提示:商场没有欺骗顾客,因为奖金的平均数确实是249元,但是奖金的平均数不能很好地代表中奖的一般金额,91.6%的奖券的奖金不超过80元.如果遇到开奖问题应该关心中奖金额的众数等数据信息.
归纳总结
平均数、中位数、众数的联系与区别
区别:
平均数能充分利用各数据,在实际中较为常用,但受极端值影响,任何一个数据的变动都会引起平均数的变动;
中位数仅与数据的排列位置有关,不受极端值或某些数据的变动;
众数主要研究各数据出现的次数,其大小只与这组数据中的某些数据有关.
联系:都反映了一组数据的集中趋势.
平均数、中位数、众数的用法
(1)没有极端值,数据相差不大时,选用平均数有较强的代表性;如评价学生成绩用平均分,班级学生平均身高,裁判一般以平均成绩为选手最终得分等.
(2)有特别大或特别小的数据时就不能用平均数,而是用中位数比较好 ;如知道某学生在班上是处于中上水平还是中下水平,应选用中位数.
(3)当数据有明显集中趋势时,宜使用众数.日常生活中诸如“最佳”、“最受欢迎”、“最满意”等.
在实际选用时,要记住三个统计量并不总是有意义的,不总是合适的,都有各自不同的适用范围.
某农业科学院专家为某地选择合适的甜玉米种子,选择种子时,甜玉米的产量和产量的稳定性是专家所关心的问题,为了解甲、乙两种甜玉米种子的相关情况,专家各用10块自然条件相同的试验田进行试验,得到各试验田每公顷的产量(单位:t)如下表所示.
根据这些数据估计,专家应该选择哪种甜玉米种子呢?
思考:你能由由样本平均数估计总体平均数吗?
为了直观地观察甲、乙两种甜玉米在各试验田产量的分布情况,你能把表中的两组数据分别用图形进行描述吗?
比较两幅图可以看出,甲种甜玉米在各试验田的产量波动较大,多个产量离平均产量较远;而乙种甜玉米在各试验田的产量波动较小,较集中地分布在平均产量附近.因此,从直观上判断乙种甜玉米的产量稳定性更好.如何用一个值刻画一组数据的波动程度或离散程度.
正如图所呈现的,当数据分布比较分散时,数据与平均数的差异相对较大;当数据分布比较集中时,数据与平均数的差异相对较小.反过来也成立.这样,为了全面反映一组数据的离散程度,可以通过数据与平均数的差异来刻画.
用方差刻画数据的离散程度:方差反映了每个数据与平均数的平均差异程度,能较好地反映出数据的离散程度,是刻画数据离散程度最常用的统计量,方差越大,数据的离散程度越大;方差越小,数据的离散程度越小.
根据样本数据计算得到的方差,叫作样本方差;根据总体数据计算得到的方差,叫作总体方差.
思考:用离差平方和是否可以刻画数据的离散程度?和方差比较,有什么不足?
离差平方和可以刻画一组数据的离散程度.在比较两组数据的离散程度时,离差平方和只适用于数据个数相同的情况,而方差则不受这个限制.
自动灌装线灌装饮料时,由于各种不可控的因素,每瓶饮料的实际含量与标准含量会存在一些误差(实际含量一标准含量).甲、乙两条灌装线同时灌装标准含量为500 mL的饮料,为了检验两条灌装线的灌装质量,从每条灌装线上各随机抽取10瓶饮料进行测量,结果(单位:mL)如下表所示.
(1)如果有一瓶饮料含量的误差的绝对值超过10 mL,此条灌装线的灌装质量为不合格,那么两条灌装线的灌装质量是否合格?
(2)哪条灌装线的灌装质量更好?
在饮料含量的误差的绝对值符合要求前提下,灌装饮料的实际含量与标准含量的差异越小,说明灌装线的质量越好.你能求出甲、乙灌装线饮料的实际含量与标准含量500 mL的误差吗?想一想用什么形式呈现更直观?
甲、乙灌装线饮料的实际含量与标准含量500 mL的误差如上表所示.从表中的数据可以看出,甲、乙灌装线灌装的误差绝对值最大分别为5mL、7mL,两者都小于10 mL,因此两条灌装线灌装的质量都是合格的.
思考:如何比较两条灌装线的灌装质量?
可以利用我们学过的平均数、中位数和众数等统计量来刻画它们的集中趋势,用方差来刻画它们的离散程度.
归纳总结:根据方差做决策
方差越大,数据的波动越大;
方差越小,数据的波动越小.
方差的适用条件:
当两组数据的平均数相等或相近时,才利用方差来判断它们的波动情况.
师生活动:教师依次出示招聘评分、跳绳排位、商铺销量、甜玉米产量等探究案例,分层抛出平均数、加权平均数、中位数、众数、方差相关问题。学生先独立列式计算,再 4 人小组研讨各统计量统计意义、适用场景与优缺点,小组代表上台结合数据讲解结论。教师巡视点拨权重、方差运算难点,结合图象直观对比数据波动,师生共同归纳四类统计量的联系与区分方法。
设计意图:遵循 “特殊实例 — 概念推导 — 对比辨析” 认知逻辑,分层拆解集中趋势与离散程度两类核心知识。借助招聘、农业生产等多元生活案例,引导学生自主推导公式、辨析统计量适用条件,结合图象直观感知方差刻画数据波动的作用。突出学生主体探究地位,打通计算与数据解读的壁垒,分层培育运算能力、逻辑推理与数据观念核心素养,构建完整统计知识框架。
· 应用新知
例1.某次体操比赛,六位评委对某选手的打分如下(单位:分)9.5,9.3,9.1,9.5,9.4,9.3
(1)求这六个分数的平均分.
(2)如果规定:去掉一个最高分和一个最低分,余下分数的平均值作为选手的最后得分,那么该选手的最后得分是多少?
解:(1)9.5+9.3+9.1+9.5+9.4+9.3/6=9.35(分)
答:这六个分数的平均分是9.35分.
(2)9.3+9.5+9.4+9.3/4=9.375(分)
答:该选手的最后得分是9.375分.
例2.下表所示是八年级4个班上交的“科技百问”小测的最终成绩统计表.
(1)求出四个班成绩的平均分.
(2)求出四个班成绩的优秀率.
解:(1) 48×86+50×83.5+45×85+57×84/48+50+45+57=16916/200=84.58,
∴四个班成绩的平均分为84.58分;
解:(2) 48×60.42%+50×54%+45×57.78%+57×47.37%/48+50+45+57×100%≈54.5%,
∴四个班成绩的优秀率为54.5%.
例3.某小区有600户家庭,从中随机抽取了100户,调查了他们12月的用水量情况,结果如图所示.
(1)试估计该小区用水量不高于20t的户数占小区总户数的百分比;
(2)把图中每组用水量的值用该组的中间值(如0~10的中间值为5)来代替,估计该小区12月的用水量.
解:(1)∵这100户中,用水量不高于20t的户数所占的百分比为50+32/100=82%,
∴估计该小区用水量不高于20t的户数占小区总户数的百分比为82%;
(2)∵这100户12月的平均用水量约为:1/100×(50×5+32×15+11×25+7×35)=12.5t,
∴估计该小区12月的用水量为600×12.5=7500t.
归纳:1.数据分组后,一个小组的组中值是指:这个小组的两个端点的数的平均数.
2.根据频数分布表求加权平均数时,统计中常用各组的组中值代表各组的实际数据,把各组的频数看作相应组中值的权.
例4. 下面两组数据的中位数是多少?
(1) 5,6,2,3,2; (2) 5,6,2,4,3,5.
解:(1) 排序后为:2,2,3, 5,6,∴中位数是3;
(2) 排序后为:2,3,4,5,5,6,∴中位数是 1/2×(4+5)=4.5.
例5.在一次男子马拉松长跑比赛中,随机抽取12名选手所用的时间(单位:min)如下:
136 140 129 180 124 154 146 145 158 175 165 148
(1)这组样本数据的中位数是多少?
(2)一名选手所用的时间是142 min,推测他的成绩是否超过这次比赛中一半以上选手的成绩?
解:(1)先将样本数据按照从小到大的顺序排列:
124 129 136 140 145 146 148 154 158 165 175 180
这组数据的中位数为处于居中两个数据146,148的平均数,即中位数为
1/2×(146+148)=147. 因此样本数据的中位数是147.
解:(2)根据(1)中得到的样本数据的中位数,可以估计,在这次马拉松比赛中,大约有一半选手的所用时间小于147 min,有一半选手的所用时间大于147 min.这名选手的所用时间是142 min,小于中位数,可以推测他的成绩比一半以上选手的成绩好.
例6.一家鞋店在一段时间内销售某种女鞋30双,各种尺码鞋的销售量如右表所示.
你能根据表中的数据为这家鞋店提供进货建议吗?
提示:一般来讲,鞋店比较关心哪种尺码的鞋销售量最大,也就是关心卖出的鞋的尺码组成的一组数据的众数.一段时间内卖出的30双女鞋的尺码组成一个样本数据,通过分析样本数据可以找出样本数据的众数,进而可以估计这家鞋店销售哪种尺码的鞋最多.
解:由表可以看出,在不同的尺码中,尺码为23.5 cm的鞋销售量最大,即众数为23.5,因此可以建议鞋店多进23.5 cm的鞋.
例7.某商场服装部为了调动营业员的积极性,决定实行目标管理,根据目标完成的情况对营业员进行适当的奖励.为了确定一个适当的月销售目标,商场服装部统计了每位营业员在某月的销售额(单位:万元),数据如下:
17 18 16 13 24 15 28 26 18 19 22 17 16 19 32
30 16 14 15 26 15 32 23 17 15 15 28 28 16 19
(1)月销售额在哪个值的人数最多?中间位置的月销售额是多少?平均月销售额是多少?
(2)如果想确定一个较高的销售目标,你认为在(1)的三个销售额中选哪一个作为销售目标合适?请说明理由.
(3)如果想让一半左右的营业员都能达到销售目标,你认为月销售额定为多少合适?请说明理由.
解:(1)整理上面的数据得到下表和下图.
解:(1)从表或图可以看出,样本数据的众数是15,中位数是18,利用计算器求得这组数据的平均数约是20.可以推测,这个服装部营业员的月销售额为15万元的人数最多,中间位置的月销售额是18万元,平均月销售额大约是20万元.
解:(2)如果想确定一个较高的销售目标,这个目标可以定为每月20万元(平均数).因为从样本数据看,在平均数、中位数和众数中,平均数最大.可以估计,月销售额定为每月20万元是一个较高目标,大约会有1/3的营业员获得奖励.
解:(3)如果想让一半左右的营业员能够达到销售目标,月销售额可以定为每月18万元(中位数).因为从样本情况看,月销售额在18万元以上(含18万元)的有16人,占总人数的一半左右.可以估计,如果月销售额定为18万元,将有一半左右的营业员获得奖励.
例8.为了考察甲、乙两种小麦的长势,分别从中抽取了10株麦苗,测得高度(单位:cm)如下:
甲:15,15,14,11,16,14,12,14,13,15;
乙:17,14,12,16,15,14,14,14,13,11.
哪种麦苗长势整齐?
归纳总结:数据的集中趋势
平均数、中位数和众数都可以刻画一组数据的集中趋势,但它们各有特点.
平均数是一组数据的平均值,计算时要用到所有的数据,它能够充分利用数据提供的信息,在现实生活中较为常用.但平均数受极端值(一组数据中与其余数据差异很大的数据)的影响较大,对于存在极端值的数据,一般平均数的代表性较差.
中位数是一组数据按大小排序后处于中间位置的数,计算简单,不易受极端值影响.但中位数不能充分利用数据提供的信息.
众数是一组数据中出现次数最多的数据,不易受极端值影响.但当各个数据的重复次数差别不大时,众数往往不具有代表性.
例9.甲、乙两名气手枪运动员进行射击训练,10次射击成绩(单位:环)如下表所示.
哪名射击运动员的发挥更稳定?
师生活动:教师依次出示打分、班级成绩、用水量估算、鞋店进货、作物长势对比等综合例题,学生独立完成计算解题,同桌互相核对运算步骤、订正计算错误。选取学生板书完整解题过程,师生共同评析答题逻辑,重点讲解加权平均数、中位数排序、方差稳定性判断的规范步骤。组织学生交流每道题选用对应统计量的理由,结合生活场景解读数据并给出合理化决策建议。
设计意图:设置分层梯度应用题,覆盖基础计算、生活估算、经营决策、产品对比多类真实场景,实现新知迁移落地。通过板书互评、说理交流,规范统计题型答题流程,强化学生根据问题背景灵活选择统计量的能力。训练学生依托数据给出理性决策,深化模型观念与数据观念,检验学生综合运用平均数、中位数、众数、方差分析现实问题的能力,贴合新课标学以致用的育人要求。
数据的四分位数与分组活动二
· 情境引入
问题 某银行有A和B两个理财产品经营团队.近三年,这两个团队分别负责经营12项理财产品,收益率(单位:%)如下:
A 4.77 3.98 6.44 4.89 2.15 3.85 3.64 3.21 3.18 2.02 4.11 4.10
B 3.18 3.84 3.99 3.67 3.40 3.60 4.10 4.21 4.15 4.44 3.87 3.91
如果你是一位购买理财产品的投资者,会选择哪个团队的产品?
师生活动:教师出示两款理财产品收益率数据,抛出投资者选品问题,学生自主计算两组数据的平均数与方差,对比得出稳定性差异。教师递进追问:仅靠均值、方差无法看清收益率集中区间,引发学生认知困惑。学生以小组为单位交流思考,发现现有统计量的局限性,主动探寻能完整展示数据分布的新统计工具,教师顺势引出四分位数、箱线图本节课学习主题。
设计意图:选用理财投资生活化真实情境,贴合学生日常认知,激活平均数、方差旧知,实现新旧知识衔接。通过层层设问制造认知冲突,让学生直观感受单一统计量分析数据的不足,激发探究百分位数、四分位数的学习内需。落实 2022 新课标数据观念素养,引导学生树立多角度、完整刻画数据分布的统计意识,为本节新知探究铺垫认知基础。
· 探究新知
A 4.77 3.98 6.44 4.89 2.15 3.85 3.64 3.21 3.18 2.02 4.11 4.10
B 3.18 3.84 3.99 3.67 3.40 3.60 4.10 4.21 4.15 4.44 3.87 3.91
我们可以用产品收益率的平均数和方差来刻画这两个团队的经营水平.通过计算,可以得到A和B两个团队产品收益率的平均数和方差分别为
因此,如果你是稳健型投资者,那么应该选择团队B经营的理财产品;如果你是激进型投资者,那么应该选择团队A经营的理财产品.
可以看出,团队B的产品收益率的平均数稍大于团队A,但差别不大;团队A的产品收益率的方差明显大于团队B,即团队B的产品收益率的稳定性要好于团队A.
思考:如果投资者还想进一步了解两个团队理财产品收益率的具体情况,例如收益率大部分在什么范围,哪些范围比较集中等信息,那么产品收益率的平均数和方差能反映出这些信息吗?
平均数和方差虽然可以反映产品收益率的集中趋势和离散程度,但无法反映出投资客户关心的这些信息.因此,我们需要能反映产品收益率更多分布信息的统计量.
一组数据按从小到大的顺序排列,中位数是从中间点把数据分成2等份,将数据分成100等份的每一分点处的值叫作这组数据的百分位数.相比中位数,百分位数可以较全面地反映出数据的分布信息.
由于每个团队的产品收益率的数据个数不多,我们可以用三个特殊的百分位数来刻画.如下所示,把团队A的产品收益率按从小到大的顺序排列,容易得到这组数据的中位数为3.915,这个值把所有数据分成2等份,所有数据中小于这个值的占50%,称3.915为这组数据的50%分位数.
在3.915左侧和右侧的数据中,还可以分别得到它们各自的中位数3.195和4.44,所有数据中小于这两个值的分别占25%和75%,称3.195和4.44分别为这组数据的25%分位数和75%分位数.由于3.195,3.915,4.44这三个值把这组按由小到大顺序排列的数据分成四等份,所以称它们为这组数据的四分位数(quartile),从小到大分别称为这组数据的第一四分位数、第二四分位数(中位数)、第三四分位数,分别记为Q₁,Q₂,Q₃.
由团队A产品收益率的三个四分位数,可以大致看出其产品收益率的分布情况.其产品收益率小于3.195%的项目数占总数的25%,产品收益率小于3.915%的项目数占总数的一半,产品收益率大于4.44%的项目数占总数的25%.产品收益率在3.195%至4.44%之间的项目数占总数的50%.
类似地,如图24.3-2,可以得到团队B产品收益率的三个四分位数分别为3.635, 3.89, 4.125.
由团队B产品收益率的三个四分位数可以知道,其产品收益率小于3.635%的项目数占总数的25%,产品收益率小于3.89%的项目数占总数的一半,产品收益率大于4.125%的项目数占总数的25%.产品收益率在3.635%至4.125%之间的项目数占总数的50%.
思考:你能总结求 n 个数据的四分位数的方法吗?
思考:老师绘制了如下图所示的A组统计图.你能读懂这个统计图吗?图中出现了 5 条横线,分别对应 5 个数据,它们是怎样的数据?你认为这个统计图是如何画出的?
为了更加直观地观察产品收益率的分布特征,我们可以用产品收益率的三个四分位数及最小值、最大值这五个数值画出箱线图.团队A产品收益率的箱线图如图所示,它主要由矩形箱体和从箱体延伸出的两条水平线段(称为须线)构成.箱线图中最左侧和最右侧的竖直线段分别表示这组数据的最小值和最大值,中间箱体的左端竖线表示第一四分位数,箱体中部的竖线表示第二四分位数(中位数),箱体的右端竖线表示第三四分位数,整个箱体的长度为第三四分位数减去第一四分位数的差,称为四分位距.由箱线图,容易看出产品收益率分布的大致情况,如分布的范围、中位数的大小、集中的范围、分布是否对称等.
类似地,你能画出团队B产品收益率的箱线图吗?
箱线图也可以按竖直方向画.为了便于比较两个团队产品收益率的分布特征,把两个箱线图按竖直方向并列画在同一幅图中,如图所示.
从图中可以发现,两个团队产品收益率的中位数几乎相等(表示中位数的水平线段差不多高),但团队A的产品收益率波动明显比团队B的大(团队A的箱体和须线比团队B的长),这与用平均数、方差比较的结果是一致的.
从箱线图中,还可以看出分布的一些其他特征,例如,团队B的产品收益率分布比团队A的更对称(中位数对应的水平线段在箱子的中间位置).
团队A有约25%的产品收益率高于团队B的最高产品收益率,也有约25%的产品收益率低于团队B的最低产品收益率.
思考:你认为箱线图在表示数据方面有什么特点 ? 与同伴进行交流.
箱线图中包含了最小值、最大值和四分位数信息,可以用来反映一组数据的整体分布情况,特别适用于多组数据整体分布情况的比较.
归纳总结:箱线图的特点
直观展示数据分布:箱体的长度直观呈现数据的离散程度,箱体短说明数据集中在中位数附近,离散程度小;箱体长说明数据较为分散. 观察中位数在箱体中的位置及须的长度可以判断数据分布的对称性. 若中位数大致在箱体正中间且上下须长度相近,说明数据分布较为对称;若中位数偏向箱体某一端,或某一侧须较长,说明数据分布不对称.
便于多组数据比较:在同一图表中绘制多个箱线图时,可以很方便地比较不同组数据的分布特征,包括中位数的差异(反映中心位置的不同)、四分位数间距的大小(体现数据的离散程度),从而快速发现组间的差异和规律.
思考:给定一组数据,如何画出其箱线图?画图的步骤如何?
(1)画数轴:画一条数轴,度量单位大小和数据的单位一致,起点比最小值稍小,终点比最大值稍大.
(2)画箱体:画一个长方形盒,两端边的位置分别对应数据的上、下四分位数. 在长方形盒内部的中位数位置画一条线段,表示中位数.
(3)画须线:从长方形盒两端边向外各画一条须线延伸至数据的最大值和最小值,分别在最大值和最小值处画一条线段.
老师记录了全班 40 名学生 1 min 跳绳的次数:
115 123 123 125 128 128 129 129 129 132
132 132 132 133 133 134 134 136 136 136
136 136 136 137 138 138 138 139 144 144
144 144 144 146 148 149 152 153 159 162
你能画出对应的箱线图吗?
(1) 根据图中间的“箱子”被136 分成了两部分,其中“下半截箱子”比较短,这说明什么 ?
(2) 请你估计一下,全班学生 1 min 跳绳次数的平均数和中位数哪个大? 你是怎么估计的 ?
“下半截箱子”比较短,说明中位数136 以下数据更集中,波动小.
平均数大.因数据中较大值(如 162 等 )会拉高平均数,中位数是中间位置代表值,故估计平均数大于中位数.
归纳总结:箱线图
箱线图:箱线图是一种用来反映一组数据的整体分布情况的统计图,特别适用于多组数据的分布情况的比较,其中包含了最小值、最大值和四分位数信息.箱线图的两种常见形式如上图所示.
一家公司向社会招聘一名员工,所有应聘者先统一参加笔试,然后根据笔试成绩确定一部分应聘者进入面试.将10名应聘者的笔试成绩(百分制)按从小到大的顺序排列如下:
58 64 68 75 76 83 85 89 90 92
你认为哪一部分应聘者应当进入面试?
自然,应当选择笔试成绩好的应聘者进人面试.那么笔试成绩怎样才算好呢?可以有不同的标准.例如,前三名或85分及以上等,不管哪种标准,目的都是把笔试成绩分成好和差两组.
提示:对笔试成绩进行分组,上面提到的标准各有其合理性,在实际中也经常被采用.但这些标准都没有考虑数据自身的特点,这可能导致两个很接近的笔试成绩被分到不同的组.例如,83分与85分的差距很小,若以“85分及以上”为好成绩的标准,则85分属于好成绩,而83分属于差成绩.而从公司确定面试应聘者的角度看,把笔试成绩相对接近的分到同一组,是一种较合理的做法.因此,笔试成绩可以根据组内差异最小的原则进行分组.
将笔试成绩按从小到大的顺序排列,使相互最接近的笔试成绩都挨在了一起,因此,要使分组后的组内差异最小,只需在已排序数据的基础上寻找分组方法,可以发现,10个笔试成绩按顺序排列形成9个间隔,如图所示,
每个间隔都可以把笔试成绩分成好和差两组,共有9种分法.
怎么刻画组内笔试成绩差异的大小呢?哪种分法能使笔试成绩好和差两组的组内差异最小?
在前面的学习中,我们知道,离差平方和可以刻画一组数据的离散程度.下面我们利用离差平方和刻画组内数据的离散程度,进而对数据进行分组.
这样,根据组内离差平方和最小的原则,能使笔试成绩相差较小的应聘者分在同一组.利用计算器或信息技术工具,可以计算出图中的9种分法的组内离差平方和(结果保留小数点后一位),如表所示.
归纳总结:
数据分组的步骤
(1)将数据由小到大排列;
(2)从m=1开始,分类讨论所有可能的分组情况;
(3)分别计算全部数据和分组后数据的平均数;
(4)计算两组的组内离差平方和(或组间离差平方和);
(5)组内离差平方和最小(或组间离差平方和最大)的分组即为最合理的分组.
特别说明:
1. 为减轻计算量,本节只讨论分为两组的情况.
2. 由小到大进行数据排序才能保证分组方案有效.
3. 若有n个数据,则有(n-1)种分组方法.
4. 其他的分组方法还有等距分组、等频分组等.
5. 建议用excel 等电脑软件进行复杂计算.
师生活动:教师结合理财产品数据分步讲解四分位数定义,学生跟随步骤排序、计算三组分位数;小组合作梳理四分位数通用求解流程,研讨箱线图五大数据要素与绘制步骤。学生自主尝试绘制跳绳数据箱线图,组内互评读图结论;再结合招聘笔试例题,合作探究离差平方和最小分组法,全班汇总分组通用步骤,教师针对计算难点补充规范方法。
设计意图:遵循“数据实例—概念生 —绘图实 —分组拓展”认知逻辑,依托理财、跳绳、招聘多场景分层拆解重难点。以自主计算、合作绘图、小组研讨为主,突出学生主体地位,让学生掌握四分位数计算、箱线图读图绘图、最优分组三类技能。培育运算能力、几何直观与数据观念,让学生学会完整解读多组数据分布特征。
· 应用新知
例1.老师记录了全班 40 名学生 1 min 跳绳的次数:
132 136 144 162 144 115 132 136 123 144
136 132 132 159 136 144 129 136 139 153
123 133 144 137 152 138 136 129 129 134
138 149 125 128 128 133 138 134 146 148
求全班学生 1min 跳绳次数的最小值、下四分位数、中位数、上四分位数和最大值.
解:最小值:115 ,最大值:162
解:将这 40 个数据由小到大排序:
115 123 123 125 128 128 129 129 129 132
132 132 132 133 133 134 134 136 136 136
136 136 136 137 138 138 138 139 144 144
144 144 144 146 148 149 152 153 159 162
例2.甲、乙两地同一天的气温记录如下表所示.请你分别计算甲、乙两地气温的四分位数,并比较甲、乙两地的气温特点.
解:在同一幅图中画出两地气温的箱线图,如上图所示.
可以看出,甲、乙两地气温的中位数相同,但甲地气温的波动明显比乙地的大,甲地约有25%时刻的气温高于乙地的最高温度,约有25%时刻的气温低于乙地的最低温度.
例3.某农场种植6块试验田,亩产量(单位:kg)如下:300,320,350,400,450,500.若将试验田分为两组,使组内离差平方和最小,如何分组?请说明分组意义.
解:将数据分成两组,共有5种情况,分别计算组内离差平方和(精确到0.01),如下表所示:由表可知,要使组内离差平方和最小,应为300,320,350一组,400,450,500一组.
意义:分组后组内产量波动小,便于分析不同种植方案的效果.
师生活动:教师出示跳绳、气温、农田产量三道梯度例题,学生独立完成数据排序、四分位数计算、箱线图对比、最优分组运算;同桌互查排序、计算、书写规范问题。邀请学生上台板书解题全过程,全班对照箱线图交流数据分析结论,教师针对四分位数定位、离差平方和计算易错点集中纠错,引导学生结合实际场景解读数据、给出合理化决策。
设计意图:设置梯度化实操例题,覆盖四分位数计算、箱线图对比、最优分组三大核心考点,实现新知迁移应用。通过板书展示、互评纠错规范统计题型解题步骤,强化学生根据箱线图分析数据分布、依托离差平方和科学分组的实操能力。训练学生用统计工具解决生活、农业、气象类实际问题,深化模型观念与数据观念,落实新课标学以致用的育人目标。
· 课堂小结
师生活动:教师和学生一起回顾本节课所讲的内容.
1. 本节课你学到了什么?
2. 平均数、中位数、众数在刻画数据的集中趋势上各有什么特点?
3. 平均数与加权平均数有什么联系和区别?举例说明加权平均数中“权”的作用.
4. 离差平方和、方差在刻画数据离散程度上各有什么特点?
5. 为什么四分位数和箱线图可以帮助我们了解数据分布的概貌?
6. 对数据进行分组,除了按组内离差平方和最小分组,你还能想出其他分组的原则吗?
7. 搜集关于“统计学”方面的资料(如学科发展史、思想方法、人物等),自选一个角度谈谈你对统计的认识.
设计意图:通过小结让学生进一步熟悉巩固本节课所学的知识.由教师引导,学生进行总结,目的是充分发挥学生的主体作用,有助于学生在理解新知识的基础上,及时把知识系统化、条理化.
· 当堂练习
1.黄河流域某河段年均流量变化数据,若一组数据28,32,30,x,34的平均数为31,则x的值为( )
A.28 B.29 C.30 D.31
解:由题意得
28+32+30+x+34/5 =31,
解得x=31.
2.一家公司打算招聘一名英文翻译,对甲、乙两位应试者进行了听、说、读、写、的英语水平测试,他们的各项成绩如表所示:
如果公司想招一名笔译能力较强的翻译, 听、说、读、写的成绩按照2:1:3:4的比确定. 谁能被录用?
3.某食品店购进2000箱苹果,从中任选10箱,称得质量(单位:kg)分别为16,16.5,14.5,13.5,15,16.5,15.5,14,14,14.5.若每千克苹果的售价为2.8元,则利用样本平均数估计这批苹果的销售额为( )
A.80000元 B.82000元 C.84000元 D.86000元
解:平均质量为16+16.5+14.5+13.5+15+16.5+15.5+14+14+14.5/10=15 kg
估计2000箱苹果的总质量为2000×1.5=30000kg,
销售额为30000×2.8=84000(元).
4.某校将每年4月的第三周定为阅读活动周.为了解学生在阅读活动周的阅读时长(单位:h),该校随机调查了a名学生,根据统计结果绘制了如下统计图.
(1)求a和m的值.
(2)求这a名学生在该周的平均阅读时长.
(3)若该校共有1600名学生,估计在该周阅读时长为5h的人数.
解:(1)a=4÷10%=40,m%=10÷40=25%,∴m=25;
(2)这a名学生在该周的平均阅读时长为
1×4+2×8+3×15+4×10+5×3/40=3;
(3)估计在该周阅读时长为5h的人数为1600×7.5%=120(人).
5.已知一组数据1,4,6,8,6,则此组数据的中位数是_________.
解:将数据从小到大重新排列为:1,4,6,6,8,这组数据共有5个,个数为奇数,根据中位数的定义,中位数为排序后第3个数, 第3个数为6,因此此组数据的中位数是6.
6.适量的运动有助于身体健康,经常运动的人在静息状态下心率的范围是60次/分~80次/分.某班的班主任随机测量了10名学生的心率,统计结果如下表所示,则这10名学生的心率数据的众数是_____.
解:由表格可得,这10个数据中,74出现的次数最多,共出现4次,因此这组数据的众数是74.
7.甲、乙两名运动员在6次百米跑训练中的成绩如下:
请你比较这两组数据的众数,平均数和中位数,再作判断.
解:甲:平均数:10.9,众数:10.8,中位数:10.85;
乙:平均数:10.8,众数:10.9,中位数:10.85.
从平均数看,甲的成绩比乙的好;从众数看,乙的成绩比甲的好;从中位数看两人成绩一样.
8.甲、乙两队进行足球点球大赛,两队所得的平均分数相同,其中甲所得分数的方差为15,乙所得分数如下:3,4,5,10,8,则成绩比较稳定的是________.
9.某校准备从甲、乙、丙、丁四个小组中选出一组参加全市中小学科技创新竞赛,下表记录了各组平时成绩的平均数(单位:分)及方差,若要选出一个成绩好且状态稳定的小组去参加比赛,则应选择的小组是( )
A.甲 B.乙 C.丙 D.丁
解:∵乙、丙的平均数为95,高于甲、丁的平均数92,
∴成绩较好的小组为乙和丙,
又∵乙的方差为3.2,大于丙的方差1.8,
方差越小成绩越稳定,
∴丙成绩好且状态稳定,故应选择丙小组.
10.某校“魅力篮球节”活动中,有8位同学各投篮10次,进球次数(单位:次)分别为6,5,4,7,6,10,9,8.则这8位同学投篮进球次数的上四分位数为______.
11.如图1所示,在箱线图中,位于最下面和最上面的实横线分别表示下边缘(最小值)和上边缘(最大值),中间箱体的底端是第一四分位数,箱体中部的“×”表示平均值,箱体的顶端是第三四分位数.异常值是明显偏离样本的个别值.已知一班和二班人数相等,在一次考试中两班成绩的箱线图如图2所示,则下列说法正确的是
A.一班成绩比二班成绩集中 B.一班成绩的第三四分位数是80
C.一班有同学的成绩超过140分 D.一班的平均分高于二班的平均分
解:由图2可知,一班成绩的极差更大,成绩分布更分散,二班成绩更集中,A错误;一班箱体顶端在100分上方,80分是一班箱体底端(第一四分位数),因此B错误;一班平均值低于100分,二班平均值高于100分,一班平均分低于二班,因此D错误.
12.某班级5名学生的成绩为60,70,78,90,100.若将其分为两组,如何分组可使组内离差平方和最小?请写出分法并计算最小值(结果保留小数点后两位).
解:将数据分成两组,为使组内离差平方和最小,只需考虑将数据按从小到大排序后,划分成连续两组的情况,共有4种,分别计算组内离差平方和如表所示:
由表可知,当按第3种分组时,组内离差平方和最小,最小值为212.67.分法为
{60,70,78}和{90,100}.
师生活动:学生做练习,教师订正答案.
设计意图:通过练习来巩固、强化课堂上所学的知识,并且培养学生综合运用所学的知识和技能解决问题的能力,培养学生的应用意识.通过分层练习,进一步提高学生学习兴趣,使学生的认知结构更加完善.同时强化本课的教学重点,突破教学难点.
单元作业设计
1、 选择题(本大题共10小题,每小题3分,共30分)
1.某社区便利店销售家用洗衣液,店主想了解哪种容量规格的洗衣液最畅销,以便合理进货.下列关于洗衣液容量规格的统计量中,最有参考意义的是( )
A.中位数 B.平均数 C.众数 D.方差
【答案】C
【分析】本题需结合店主的实际需求,根据不同统计量的意义,选出符合要求的统计量,店主的核心需求是找出最畅销,也就是出现次数最多的洗衣液容量规格.
【详解】解:∵店主需要确定最畅销的洗衣液容量规格,本质是找出出现次数最多的容量规格,
又∵众数是一组数据中出现次数最多的数,中位数反映数据的中间位置水平,平均数反映数据的平均水平,方差反映数据的波动程度,只有众数符合店主需求,
∴最有参考意义的统计量是众数.
2.某中学开展“盐都少年”主题演讲比赛,评委从演讲内容、语言表达、形象风度三个维度打分,三项得分按照权重5∶3∶2计算选手最终综合成绩.选手小辰的三项得分依次为:92分、88分、84分,则小辰的最终成绩为( )
A.88分 B.89.2分 C.90分 D.91.6分
【答案】B
【分析】通过加权平均数的计算,根据给定的权重比,按照加权平均数的计算方法即可求出最终成绩.
【详解】解:∵ 三项权重比为 ,权重总和为 ,
∴ 小辰的最终成绩为 分 ,
因此小辰的最终成绩为89.2分.
3.某校开展“非遗文化进校园”知识测试,抽取名学生的成绩(单位:分)如下:,,,,,,,,则这组数据的平均数、众数、中位数分别是( )
A.,, B.,, C.,, D.,,
【答案】B
【分析】只需先对数据排序,再根据定义分别计算三个统计量即可得到结果.
【详解】将这组数据从小到大排序得:,,,,,,,,
数据总和为,共有个数据,
平均数为;
在这组数据中出现次数最多(共次),
众数为;
数据个数为偶数,中位数为排序后中间两个数的平均数,即第个和第个数据的平均数,
中位数为;
因此这组数据的平均数,众数,中位数分别是,,.
4.小明在处理一组数据“12,12,28,35,20,■”时,不小心将其中一个数据污染了,只记得该数据在30~40之间,则“■”在范围内无论为何值都不影响这组数据的( )
A.平均数 B.众数 C.中位数 D.方差
【答案】C
【分析】根据平均数、众数、中位数、方差的定义,判断哪个统计量不随被污染数据在之间变化而改变即可.
【详解】解:设被污染的数据为,原数据除外从小到大排序为,这组数据共有个,
因此中位数为排序后第个和第个数的平均数,
在之间,
无论取何值,排序后第个数恒为,第个数恒为,
中位数恒为,不发生变化,C正确;
平均数随改变,总和发生变化,因此平均数改变,A错误;
若,众数变为和,发生改变,B错误;
方差随数据和平均数改变,因此方差改变,D错误.
5.随着上海国际花卉节的举行,这两天,上海街头各异的绿化带造型,频频在社交媒体上引发爆点.如图,园林工人将绿化带上参差不齐的植物修剪平整,在此过程中绿化带上植物高度的平均数与方差均发生变化.关于这两个统计量的变化情况,下面描述正确的是( )
A.平均数变小,方差变小 B.平均数变小,方差变大
C.平均数变大,方差变小 D.平均数和方差均不变
【答案】A
【分析】根据题意得出现有的高度一定小于等于原先的高度,即平均数变小,平整即波动变小了,方差就变小.
【详解】解:根据题意得,园林工人将绿化带上参差不齐的植物修剪平整,即现有的高度一定小于等于原先的高度,波动变小了,方差就变小,
∴平均数变小,方差变小.
6.九年级某小组的8名同学每分钟跳绳的个数分别为165,182,136,112,145,171,155,93.这组数据的第一四分位数是( )
A. B.168 C.124 D.150
【答案】C
【分析】本题考查第一四分位数的计算,解题思路为先对数据从小到大排序,第一四分位数为前一半数据的中位数,计算即可得到结果.
【详解】解:将原数据从小到大排序得:,
∵总共有8个数据,第一四分位数是前4个数据的中位数,前4个数据为,
∴第一四分位数是.
7.一项比赛共有8位评委,选手完成比赛后,每位评委现场给出一个“初始评分”,去掉一个最高分,去掉一个最低分,剩余6位评委的评分为“有效评分”.则下列叙述一定正确的是( )
A.同一个选手的“初始评分”的中位数小于“有效评分”的中位数
B.同一个选手的“初始评分”的下四分位数等于“有效评分”的下四分位数
C.同一个选手的“初始评分”的平均数不低于“有效评分”的平均数
D.同一个选手的“初始评分”的方差不低于“有效评分”的方差
【答案】D
【分析】本题考查中位数,下四分位数,平均数,方差的定义,将初始评分排序后,结合定义逐一判断各选项即可得到结果.
【详解】将8位评委的初始评分从小到大排序,记为,
去掉最低分和最高分后,有效评分从小到大排序为,
对选项A:初始评分共8个数据,中位数为,有效评分共6个数据,中位数仍为,两者相等,因此A错误;
对选项B:初始评分的下四分位数为,有效评分的下四分位数为,两者不一定相等,因此B错误;
对选项C:举反例,取,,,初始评分的平均数为,有效评分的平均数为,此时初始评分的平均数小于有效评分的平均数,因此C错误;
对选项D:方差衡量数据的波动程度,去掉波动最大的最高分和最低分,数据波动不会增大,若所有评分相等,初始和有效方差都为0,相等,若评分不全相等,去掉最高分和最低分后方差减小,因此初始评分的方差一定不低于有效评分的方差,D正确.
8.若样本,,…,的平均数为,方差为,则对于样本,,…,,下列结论正确的是( )
A.平均数为,方差为 B.平均数为,方差为
C.平均数为,方差为 D.平均数为,方差为
【答案】B
【分析】根据平均数和方差的性质,一组数据中每个数据同时加上同一个常数,平均数增加该常数,方差不变,根据平均数和方差的定义推导即可得到结果.
【详解】解:∵样本,,…,的平均数为10,
∴,
整理得,即,
则样本,,…,的平均数为:;
又∵样本,,…,的方差为6,
∴,整理得,
则样本,,…,的方差为:.
9.某次射击比赛,甲队员的成绩如图,根据此统计图,下列结论中错误的是( )
A.最高成绩是9.4环 B.平均成绩是9环
C.这组成绩的众数是9环 D.这组成绩的方差是8.7
【答案】D
【详解】解:A、由统计图得,最高成绩是9.4环,选项说法正确,不符合题意;
B、平均成绩为,选项说法正确,符合题意;
C、由统计图得,9出现了3次,出现的次数最多,故众数是9环,选项说法正确,不符合题意;
D、这组成绩的方差是,选项说法错误,符合题意.
10.当5个自然数a,b,5,6,6从小到大排列后,其中位数是5,如果这组数据唯一的众数是6,那么所有满足条件的a,b中,的最大值是( )
A.12 B.10 C.8 D.6
【答案】A
【分析】根据中位数和众数的定义确定的取值范围,再找出满足条件的使取最大值.中位数定义为奇数个数据从小到大排列后,位于中间位置的数;唯一众数要求6的出现次数大于其他所有数的出现次数.
【详解】解:∵这组数据共5个,从小到大排列后中位数是第3个数,且中位数为5,而已知数据中有两个6大于5,
∴排列后第3个数是5,可得 ,
∵原数据中6已经出现2次,且这组数据的唯一众数是6,
∴其他数的出现次数都必须小于2,若中有1个是5,则5出现2次,和6次数相同,众数不唯一;
若 ,则这个数出现2次,和6次数相同,众数不唯一;
若都是5,则5出现3次,众数为5,均不符合要求,
∴ ,为不同自然数,要使最大,取满足条件的最大,得,,
∴.
2、 填空题(本大题共5小题,每小题3分,共15分)
11.某果农种植的金桔在采摘完后,发现大果、中果和小果的产量比为,若每斤的售价大果定为12元,中果定为8元,小果定为6元,则该批金桔的平均售价为每斤__________元.
【答案】
【分析】设大果、中果和小果的产量分别为斤,斤,斤,,根据平均售价等于总售价除以总产量即可求解.
【详解】解:∵大果、中果和小果的产量比为,
∴设大果、中果和小果的产量分别为斤,斤,斤,其中
∴这批金桔的平均售价为(元/斤).
12.在体育运动技能测试中,参与排球连续垫球项目的15名学生的成绩如下表所示:
个数
18
21
25
27
30
35
人数
2
1
4
3
3
2
则这15名学生连续垫球个数的众数是________个.
【答案】25
【分析】根据众数的定义,一组数据中出现次数最多的数据叫做众数,结合表格中的数据即可确定众数.
【详解】解:由统计表可知,垫球个数为25的人数最多,为4人,
∴众数为25.
13.甲、乙、丙三名同学参加短跑测试,已知他们几次测试成绩的平均数相同,方差如下:,,,则成绩最稳定的是______.
【答案】丙
【详解】解:∵,
∴,
因此,成绩最稳定的是丙.
14.农业技术人员在两块小麦试验田中各随机抽取10株小麦,测量株高(单位:cm),并绘制出如下折线统计图,则小麦株高长势更稳定的是______试验田.(填“甲”或“乙”)
【答案】乙
【详解】解:由折线统计图,可知乙试验田的数据波动较小,说明乙试验田的小麦株高长势更稳定.
15.将一组数据1,2,3,4,5,6分成前3个一组,后3个一组,则这组数据的组内离差平方和是_______.
【答案】4
【分析】先按题目要求分组,再分别计算每组的平均数与每组的组内离差平方和,将两组的组内离差平方和相加即可得到结果.
【详解】解:由题意得,前个数据为第一组:,,,后个数据为第二组:,,,
计算第一组的平均数:,
第一组的组内离差平方和:;
计算第二组的平均数:,
第二组的组内离差平方和:,
则总的组内离差平方和为.
三、解答题(共9小题,共75分)
16.一家公司打算招聘一名英文翻译.对甲、乙两名应试者进行了听、说、读、写的四项英语水平测试,他们的各项成绩(百分制)如下表所示(该公司以四项成绩的平均数为录取依据).
应试者
听
说
读
写
甲
90
85
80
80
乙
80
85
80
90
(1)若这家公司想招一名笔译能力较强的英文翻译,听、说、读、写的成绩按2134的比例确定,则该公司应录取谁,请说明理由;
(2)如果这家公司想招一名口译能力较强(听、说的成绩比读、写更加“重要”)的英文翻译,设听、说、读、写的成绩按的比例确定(其中),试说明:无论取何值,该公司均录取甲.
【答案】(1)该公司应录取乙,理由如下:
甲的成绩为
乙的成绩为,
∵,
∴乙的成绩高于甲的成绩,
∴该公司应录取乙;
(2)
甲的成绩为,
乙的成绩为,
∵,且,
∴,
即甲的成绩大于乙的成绩,
∴无论取何值,该公司均录取甲.
【分析】(1)分别计算甲和乙的加权平均数,比较大小即可;
(2)分别计算甲和乙的加权平均数,用作差法比较大小即可.
【详解】(1)略
(2)略
17.今年央视春晚节目《秧》别出心裁,人机共舞为文化传承搭建了新的桥梁,随着科技的发展机器人在人们生活中应用广泛,某实践小组对某款聊天机器人的使用满意度进行了问卷调查,并对数据进行整理、描述和分析(测试满分为100分,所有问卷结果都在60分以上,评分分数用x表示,结果分为四个等级:“不满意”:,“比较满意”:,“满意”:,“非常满意”:),部分信息如下:
信息一:
信息二:评分“满意”等级的数据(单位:分)如下:80,81,81,82,82,83,84,84,88.
根据以上信息,解答下列问题:
(1)补全频数分布直方图,并求所抽取的机器人使用满意度的结果为“非常满意”的人数;
(2)求出所抽取的机器人使用满意度评分的中位数;
(3)若有1000人购买了本款聊天机器人,请估计这1000人中对本款机器人“满意”的人数.
【答案】(1)补全频数分布直方图见解析;6人
(2)分
(3)450人
【分析】(1)用“满意”的人数除以所占百分比可得调查抽取总数,进而求出“非常满意”等级的人数,并补全频数分布直方图;
(2)根据中位数的定义求解即可;
(3)利用“样本估计总体”进行求解即可.
【详解】(1)解:调查抽取的总人数为:人,
则“非常满意”的人数为:人,
补全频数分布直方图如下:
(2)解:由频数分布直方图可知,使用满意度的结果为“不满意”有2人,“比较满意”的有3人,“满意”有9人,
则中位数位于“满意”等级,
将评分“满意”等级的数据从小到大排列:
80,81,81,82,82,83,84,84,88,
则中位数为分;
(3)解:人
答:这1000人中对本款机器人“满意”的人数为450人.
18.重庆市是一座幅员辽阔,资源丰富,历史悠久的文化名城,是我国第四个直辖市.为了让学生了解重庆的历史变迁,传承巴渝文化,某中学在九年级学生中举办了一场学重庆历史,知巴渝文化的历史知识竞赛,并从甲、乙两个校区各随机抽取名学生的竞赛成绩,进行整理、描述和分析,并绘制成如下不完整的统计图表竞赛成绩用表示,总分为分,共分成四个等级,其中优秀:;良好:;合格:;不合格:,下面给出了部分信息:
甲校区中属于良好等级的学生成绩(单位:分)为:
,,,,,,,.
乙校区被抽取学生的成绩单位:分为:
,,,,,,,,,,,,,,,,,,,.
甲、乙两校区被抽取学生的成绩统计表
校区
甲校区
乙校区
平均数
80
80
中位数
a
83
众数
82
根据以上信息,解答下列问题:
(1)填空:___________,___________,并补全条形统计图;
(2)已知甲校区九年级学生有名,乙校区九年级学生有名,请估计这所中学这次竞赛成绩达到优秀、良好等级的共有多少人?
(3)根据以上统计数据,你认为甲、乙两个校区中哪个校区的学生竞赛成绩更好?请说明理由(写出一条理由即可).
【答案】(1),,补全统计图见解析
(2)估计这所中学这次竞赛成绩达到优秀、良好等级的共有人
(3)乙校区的学生竞赛成绩更好
【分析】(1)先根据甲校区的总人数和条形统计图、良好等级的成绩数据,确定甲校区各等级人数,再求中位数;根据乙校区的成绩数据,找出出现次数最多的数,确定众数;最后根据人数补全条形统计图.
(2)先分别计算甲、乙校区样本中优秀、良好等级的人数占比,再结合两个校区的总人数,用样本估计总体的方法,计算出两个校区优秀、良好等级的总人数并求和.
(3)对比甲、乙校区的中位数、众数、优秀率等统计量,选择一个能体现成绩优劣的统计量进行分析,给出合理结论.
【详解】(1)解:甲校区不合格人数,
甲校区合格人数,
甲校区良好人数,
甲校区优秀人数.
将甲校区名学生成绩从小到大排列,第、个数据均在良好等级中,为和,
∴
乙校区成绩中出现的次数最多,
∴.
补全统计图如下:
(2)解:人,
答:估计这所中学这次竞赛成绩达到优秀、良好等级的共有人;
(3)解:乙校区的学生竞赛成绩更好.
理由:两个校区抽取学生成绩的平均数相同,乙校区成绩的中位数大于甲校区成绩的中位数,
∴乙校区的学生竞赛成绩更好.
19.下面分别给出了25个男生和25个女生的肺活量(单位:L):
女生组:2.7,2.8,2.9,3.1,3.1,3.1,3.2,3.4,3.4,3.4,3.4,3.4,3.5,3.5,3.5,3.6,3.7,3.7,3.7,3.8,3.8,4.0,4.1,4.2,4.2.
男生组:4.1,4.1,4.3,4.3,4.5,4.6,4.7,4.8,4.8,5.1,5.3,5.3,5.3,5.4,5.4,5.5,5.6,5.7,5.8,5.8,6.0,6.1,6.3,6.7,6.7.
请画出这两组数据的箱线图.
【答案】见解析
【分析】本题主要考查了四分位数的计算和箱线图的绘制与解读,通过这些工具可以直观地分析数据的分布特征.
先计算出这两组数据的四分位数,然后根据计算出的四分位数绘制箱线图即可.
【详解】解:女生组:最小值为2.7,最大值为4.2,.
男生组:最小值为4.1,最大值为6.7,,,.画出箱线图如图.
20.【问题背景】某生物兴趣小组探究施肥量对番茄苗生长高度的影响:随机选取40株长势完全相同的番茄苗,平均分成两组(每组20株),一个组施加剂量肥料,另一个组施加剂量肥料.
【实践发现】一周后,同学们对两组番茄苗的生长高度进行了测量(番茄苗生长高度用表示,单位为厘米,分为四组:A.;B.;C.;D.)下面给出部分信息:
剂量组中番茄苗生长高度在区间的数据为:,,,,,.
剂量组中番茄苗生长高度的数据为:,,,,,,,,,,,,,,,,,,,.
【分析数据】
两种剂量组中番茄苗生长高度统计表
剂量
平均数
12
12
中位数
12
众数
13
剂量组中番茄苗生长高度扇形统计图
【解决问题】
(1)上述图表中________,________,________;
(2)请判断哪种剂量更利于番茄苗的生长,并说明理由;(写出一条理由即可)
(3)种植基地用剂量培育株,剂量培育株番茄苗.一周后,生长高度低于厘米的植株需要加大剂量施肥,估计一共需要加大剂量施肥的番茄苗有多少株?
【答案】(1);,
(2)剂量更适合番茄苗的生长.
理由:∵剂量组中番茄苗生长高度的中位数大于剂量组中番茄苗生长高度的中位数.
∴剂量更适合番茄苗的生长.
(3)估计一共需要加大剂量施肥的番茄苗有株
【分析】(1)计算剂量组中番茄苗生长高度在各区间的数量,根据中位数的定义可得a,根据众数的定义可得b,根据剂量组中番茄苗生长高度在各区间的百分比之和等于1,可得m;
(2)比较中位数的大小即可;
(3)用两种剂量的番茄苗总数分别乘以对应的长度在A区间所占的比例,相加即可.
【详解】(1)解:剂量组中番茄苗生长高度在区间的数据个数为:(个);
剂量组中番茄苗生长高度在区间的数据个数为6个,两区间共有14个数据,
20个数据按从小到大排列最中间的两个数据为第10,11个,即10,11,
故中位数;
∵剂量组中番茄苗生长高度的数据中,出现次数最多的为12,
∴,
∵B区间番茄苗生长高度的数据中,所占百分比为,
∴,
∴;
(2)略
(3)解:(株),
答:估计一共需要加大剂量施肥的番茄苗有700株
21.为推进“阳光体育”活动,某校大课间共开展6项体育活动,每名学生均参加其中一项活动.为了解该校学生参与大课间体育活动情况,随机抽取了该校60名学生进行调查,得到如下未完成的统计表.
体育活动
足球
篮球
排球
乒乓球
跳绳
羽毛球
人数
11
10
8
15
6
两名同学近八周定点投篮测试成绩折线图
(1)表格中的值为______;
(2)若该校有1200名学生,请估计该校参加跳绳活动的学生人数;
(3)为备战校际篮球联赛,学校计划从参加篮球活动的甲、乙两名同学中选拔一人加入校篮球队.已知甲、乙两名同学近八周定点投篮测试成绩(每次测试共有12次投篮机会,以命中次数作为测试成绩)如图所示.你建议选拔哪名同学,请说明理由.
【答案】(1)10
(2)该校参加跳绳活动的学生300人
(3)建议选拔甲同学,理由:
(次)
(次)
,
从平均数的角度看,甲,乙两位同学的平均数都是8次,说明两位同学的平均水平相当;从方差的角度看,甲同学的方差小于乙同学的方差,说明甲的稳定性好,所以建议选拔甲同学
【分析】(1)用总人数减去其他体育活动的人数即可;
(2)用全校人数乘以参加跳绳活动的学生的占比即可;
(3)先分别算出甲、乙两名同学的平均成绩以及方差,然后进行决策即可.
【详解】(1)解:,
故的值为;
(2)解:(人)
答:该校参加跳绳活动的学生300人.
(3)略
22.某校组织校园安全知识竞赛,甲、乙两组的测试成绩如下:
甲:91,96,70,89,60,70,100,80,92,98;
乙:92,93,70,88,82,75,96,80,92,95.
(1)求甲组数据的最小值、第一四分位数、中位数、第三四分位数和最大值;
(2)根据四分位数可绘制如图所示的箱线图,观察图中乙组的箱线图,绘制甲组的箱线图.
(3)请根据你对箱线图和四分位数的理解,谈谈你对这两组成绩的看法.
【答案】(1)最小值是60,第一四分位数是70,中位数是,第三四分位数是96,最大值是100
(2)甲组的箱线图如图所示:
(3)根据箱线图和四分位数,可知甲组数据跨度大更分散,乙组数据紧凑更集中
【分析】(1)把甲的成绩从小到大排列,中位数是第个数据的平均数,第一四分位数为第3个数,第三四分位数为第8个数,即可求解最大值和最小值;
(2)将3个四分位数及最大和最小值在图中画出即可;
(3)结合箱线图及四分位数,比较成绩的离散程度即可.
【详解】(1)解:把甲组的成绩按从小到大的顺序排列为60,70,70,80,89,91,92,96,98,100,
∴最小值是60,第一四分位数是70,中位数是,第三四分位数是96,最大值是100;
(2)略
(3)略
23.五月是荔枝上市的时节,此时市场上售价为元至元之间.某水果公司以元的成本价新进箱荔枝,每箱质量.在出售荔枝前,需要去掉损坏的荔枝,现随机抽取箱,去掉损坏荔枝后称得每箱的质量(单位:)如下:
4.7 4.8 4.6 4.5 4.8 4.9 4.8 4.7 4.8 4.7 4.8 4.9 4.7 4.8 4.5 4.7 4.7 4.9 4.7 5.0
整理数据:
质量()
数量(箱)
分析数据:
平均数
众数
中位数
(1)直接写出上述表格中,的值;
(2)平均数、众数、中位数都能反映这组数据的集中趋势,请根据以上样本数据分析的结果,选择一个统计量,估算这箱荔枝共损坏了多少千克?
(3)结合(2)中的结果,你认为该公司这批荔枝售价定为每千克多少钱合适?请说明理由.(若有计算,结果保留一位小数)
【答案】(1)
(2)选择平均数,估算这2000箱荔枝共损坏千克(答案不唯一)
(3)售价定为每千克约元合适
【分析】(1)先根据众数和中位数的定义求出,
(2)依题意,利用样本估计总体估算总损坏质量,即可作答.
(3)根据总成本不超过总销售额,计算不亏本的最低售价,结合题目给出的市场价范围得到合适定价,即可作答.
【详解】(1)解:根据表格数据,质量为的箱数最多,为7箱,
因此众数;
共抽取20箱数据,将数据从小到大排列,中位数为第10个和第11个数据的平均数,
质量为有2箱,质量为有1箱,质量为有7箱,
因此前个数据中,
第10个数据为,第11个数据为,
因此中位数,
即.
(2)解:依题意,选择平均数,
∵样本平均数为,每箱原本质量为,
因此每箱平均损坏质量为,
总共有2000箱,因此总损坏质量为.
(3)解:由(2)得总损坏质量为,
计算可得: 总成本为(元),
可出售的荔枝总质量为,
要保证不亏本,每千克售价至少为(元),
∵结果保留一位小数,且市场价元元范围
因此定价为每千克约元合适,既不亏本也符合市场定价区间.
24.三个小组(每组20人)答一道满分为4分的题目,得分情况如下:
(1)请分别计算三个小组该题的平均得分和方差.
(2)观察这三个小组的得分情况,小明发现,“柱子的高度”总是1,2,3,6,8,但是它们排列的顺序不同,导致了平均数和方差发生了变化.若将这些“柱子”重新排列,则如何排列能使平均数最大?如何排列能使方差最小?
(3)如果用三个箱线图分别表示这三个小组的成绩,那么这三个箱线图有什么差异?
【答案】(1)第一组:;;第二组:,;第三组:,
(2)因为,所以应当按照第一组排列,使平均数最大;因为 所以应当按照第三组排列,使方差最小
(3)见解析
【分析】本题考查条形统计图和箱线图、方差、中位数和平均数,会绘制箱线图是解答的关键.
(1)根据平均数和方差公式求解即可;
(2)根据(1)中求解数据,结合条形统计图可得结论;
(3)先分别求得三组的中位数,下四分位数,上四分位数,以及最大值和最小值,然后分别画出箱线图,再根据箱线图的特点分析可得答案.
【详解】(1)解:第一组平均数(分),
方差;
第二组:(分),
方差;
第三组:(分),
方差;
(2)解:因为,所以第一组得高分的人数较多,应当按照第一组排列,使平均数最大;
因为所以第三组离平均分近的人数较多,应当按照第三组排列,使方差最小;
(3)解:第一组:最小值为0,下四分位数是,中位数是,上四分位数是,最大值为4;
第二组:最小值为0,下四分位数是,中位数是,上四分位数是,最大值为4;
第三组:最小值为0,下四分位数是,中位数是,上四分位数是,最大值为4;
三个小组得分的箱线图如图所示:
由图知,第一组的“箱体”靠近最大值,说明第一组的中高分较多,中位数和平均数较大;
第二组的“箱体”靠近最小值,说明第二组的中低分较多,得分的中位数和平均数较小;
第三组的“箱体”处于中间偏上位置,且得分集中在2分到3分之间,说明第三组的中档分较多,平均分略微高于中位数,方差小,得分较稳定.
3/3
学科网(北京)股份有限公司
$