内容正文:
单元复习 人教版(新教材) 八年级下册 第二十四章 数据的分析 知识结构 考点精讲 典例专练 反馈练习 回顾反思 平均数 数据 中位数 众数 离差平方和 方差 四分位数 组内离差平方和最小 离散程度 集中趋势 大致分布 分组 总体平均数 总体平均数 样本估计总体 样本估计总体 知识结构 考点精讲 典例专练 反馈练习 回顾反思 考点 1 数据的集中趋势 1.一般地,对于n个数x1, x2, …, xn,我们把 叫做这n个数的算术平均数,简称平均数. 2.在求n个数的算术平均数时,如果x1出现f1次,x2出现 f2 次,…,xk 出现 fk 次(这里f1+f2+…+fk=n)那么这n个数的算术平均数 也叫做x1,x2,…,xk这k个数的加权平均数,其中f1,f2,…,fk分别叫做x1,x2,…,xk的权. 4.实际生活中经常用样本的平均数来估计总体的平均数. 3.组中值是指两个端点的数的平均数.把各组的频数看作相应组中值的权. 知识结构 考点精讲 典例专练 反馈练习 回顾反思 考点 1 数据的集中趋势 5.将一组数据按照由小到大(或由大到小)的顺序排列: 如果数据的个数是奇数,则称处于中间位置的数为这组数据的中位数; 如果数据的个数是偶数,则称中间两个数据的平均数为这组数据的中位数. 6.如果已知一组数据的中位数,那么可以知道,小于或大于这个中位数的数据各占一半,反映一组数据的中间水平. 知识结构 考点精讲 典例专练 反馈练习 回顾反思 考点 1 数据的集中趋势 7.一般地,把一组数据中出现次数最多的那个数据叫做众数. 如果一组数据中有两个或两个以上的数据出现的次数并列最多,那么把这几个数据都作为这组数据的众数;如果一组数据中没有出现相同的数据,那么就认为这组数据没有众数.众数也是刻画数据集中趋势的一种统计量,当一组数据有较多的重复数据时,众数往往能较好地反映其集中趋势. 平均数能充分利用各数据,在实际中较为常用,但受极端值影响,任何一个数据的变动都会引起平均数的变动; 众数主要研究各数据出现的次数,其大小只与这组数据中的某些数据有关. 中位数仅与数据的排列位置有关,不受极端值或某些数据的变动; 中等水平 多数水平 平均水平 知识结构 考点精讲 典例专练 反馈练习 回顾反思 选手 甲 乙 演讲内容 80 85 演讲能力 90 85 演讲效果 90 90 一次演讲比赛中,评委将从演讲内容、演讲能力、演讲效果三个方面为选手打分,各项成绩均为百分制,然后按演讲内容占50%、演讲能力40%、演讲效果占10%计算选手的综合成绩(百分制).进入决赛 解:甲的综合成绩: 乙的综合成绩: ∵ ∴乙的综合成绩更高. 的两名选手的单项成绩如下表所示,则两人的综合成绩( ) A.甲高 B.乙高 C.一样高 D.无法比较 知识结构 考点精讲 典例专练 反馈练习 回顾反思 已知一组数据:2,2,5,3,7,4,2则这组数据的众数和中位数分别是( ) A.3,2 B.2,3 C.2,2 D.2,4 解:∵数据为2,2,5,3,7,4,2,其中2出现了3次,出现次数最多, ∴众数为2, 把这组数据从小到大排列为:2,2,2,3,4,5,7,这组数据共7个数,个数为奇数,中间位置的数是第4个数,为3, ∴中位数为3, ∴这组数据的众数和中位数分别是2,3. 知识结构 考点精讲 典例专练 反馈练习 回顾反思 小丽 小强 平时作业/分 80 87 期中考试/分 82 84 期末考试/分 92 90 (1)解:小丽的平均成绩为 分, 小强的平均成绩为 分, , 平均成绩更高的同学是小强,该同学的平均成绩是87分. 李老师在计算学生的学期综合成绩时,从平时作业、期中考试、期末考试三个方面进行考核,各项满分均为100分.小丽和小强两位同学的各项成绩如表所示: 根据以上信息,解答下列各题. (1)这两人中平均成绩更高的同学是_____,该同学的平均成绩是______分. 知识结构 考点精讲 典例专练 反馈练习 回顾反思 小丽 小强 平时作业/分 80 87 期中考试/分 82 84 期末考试/分 92 90 李老师在计算学生的学期综合成绩时,从平时作业、期中考试、期末考试三个方面进行考核,各项满分均为100分.小丽和小强两位同学的各项成绩如表所示: (2)若对平时作业、期中考试、期末考试的成绩分别赋予它们2,2,6的权,请计算小丽的平均成绩. (2)解:小丽的加权平均成绩为 =87.6分. 知识结构 考点精讲 典例专练 反馈练习 回顾反思 针对练习 详解 若样本的平均数为10,方差为6,则对于样本,下列结论正确的是( ) A.平均数为10,方差为6 B.平均数为12,方差为6 C.平均数为10,方差为8 D.平均数为13,方差为9 解:∵样本的平均数为10, ∴ , 整理得,即 , 则样本的平均数为: 知识结构 考点精讲 典例专练 反馈练习 回顾反思 针对练习 详解 若样本的平均数为10,方差为6,则对于样本,下列结论正确的是( ) A.平均数为10,方差为6 B.平均数为12,方差为6 C.平均数为10,方差为8 D.平均数为13,方差为9 又∵ ∴ 则新样本的方差为: 知识结构 考点精讲 典例专练 反馈练习 回顾反思 针对练习 详解 某次射击比赛,甲队员的成绩如图,根据此统计图,下列结论中错误的是( ) A.最高成绩是9.4环 B.平均成绩是9环 C.这组成绩的众数是9环 D.这组成绩的方差是8.7 解:A、由统计图得,最高成绩是9.4环,选项说法正确,不符合题意; B、平均成绩为 ,选项说法正确,符合题意; C、由统计图得,9出现了3次,出现的次数最多,故众数是9环,选项说法正确,不符合题意; D、这组成绩的方差是 选项说法错误,符合题意. 知识结构 考点精讲 典例专练 反馈练习 回顾反思 针对练习 详解 学校抽查了30名学生参加社会实践活动的次数,并根据数据绘制成条形统计图,如图,则30名学生参加活动的平均次数是____次. 解:30名学生参加活动的平均次数是 (次). 知识结构 考点精讲 典例专练 反馈练习 回顾反思 考点 2 数据的离散程度 叫作这n个数据关于平均数的离差平方和(sum of squares of deviations),记作“d 2”.把离差的平方的平均数 叫作这组数据的方差(variance),记作“s2”. 2.方差反映了每个数据与平均数的平均差异程度,能较好地反映出数据的离散程度,是刻画数据离散程度最常用的统计量,方差越大,数据的离散程度越大;方差越小,数据的离散程度越小. 知识结构 考点精讲 典例专练 反馈练习 回顾反思 平均数 方差 甲 9.41 0.31 乙 9.45 0.022 丙 9.45 0.036 某校举行射击比赛,下表记录了甲、乙、丙三名参赛选手成绩的平均数和方差. 根据表中的数据,要选择一名成绩好且发挥稳定的学生参加比赛,应选择________.(填“甲”或“乙”或“丙”) 解:丙和乙的平均数较大,从丙和乙中选择一人参加比赛. 乙的方差较小,成绩更稳定,选择乙参加比赛. 知识结构 考点精讲 典例专练 反馈练习 回顾反思 已知一组数据-10,x,0,11,-12的平均数是0,则这组数据的方差是________. 解:由题意得: , 数据的方差 . 知识结构 考点精讲 典例专练 反馈练习 回顾反思 针对练习 详解 平均成绩(单位:环) 方差 甲 6.78 6.91 乙 7.67 0.72 射箭运动项目中,新手成绩通常不太稳定.甲和乙同时进行次射箭练习后,成绩的统计数据如下表,请根据表中信息估计新手是________.(填写“甲”或“乙”) 解:由表格可知,甲的平均成绩为6.78环,低于乙的平均成绩7.67环,甲的方差6.91,大于乙的方差0.72. ∵方差越大,成绩的波动越大,成绩越不稳定,符合新手成绩不稳定的特点, ∴新手是甲 . 知识结构 考点精讲 典例专练 反馈练习 回顾反思 针对练习 体育老师打算从甲、乙、丙三名同学中选择一名同学参加立定跳远比赛.对这三名同学最近6次立定跳远测试成绩(单位:)的数据进行整理、描述和分析. ①甲、乙两名同学6次测试成绩折线图: ②丙同学6次测试成绩:250,250,255,256,257,259; ③三名同学6次测试成绩的平均数、中位数、方差: (1)填空:m=________,n=________,p=________; (2)你认为选派哪一名同学参加比赛更合适,并说明理由. 平均数/cm 中位数/cm 方差/cm2 甲 255 m 1 乙 255 255.5 n 丙 p 255.5 11.58 知识结构 考点精讲 典例专练 反馈练习 回顾反思 详解 (1)解:甲同学的六次成绩分别为255,256,255,256,255,253, 从小到大排列为:253,255,255,255,256,256, 中位数 (2)选派甲同学参加比赛更合适,理由:由(1)可得,甲和乙的平均数相同且大于丙的平均数,甲的方差小于乙的方差, ∴甲乙的平均成绩高,∴在甲乙中选, 又∵甲的方差小,发挥更稳定, 故选派甲同学参加比赛更合适. 知识结构 考点精讲 典例专练 反馈练习 回顾反思 考点 3 数据的四分位数 类比中位数:排序→定位→取值 数据的 四分位数 第一四分位数 第二四分位数 第三四分位数 下四分位数 中位数 上四分位数 Q₁ Q₂ Q₃ 小 大 名称 符号 顺序 求法 知识结构 考点精讲 典例专练 反馈练习 回顾反思 考点 3 数据的四分位数 (1)先将这组数据从小到大排列; (2)计算中位数即 50% 分位数Q2: (3)计算下四分位数Q1、上四分位数Q3: ①当n为偶数时,中位数将这组数据分为数量相等的两组数据,每组有 个数, Q1为前 个数据的中位数,Q3为后 个数据的中位数; ②当n为奇数时,中位数将这组数据分为数量相等的两组数据,每组有 个数,Q1为前 个数据的中位数,Q3为后 个数据的中位数. 知识结构 考点精讲 典例专练 反馈练习 回顾反思 考点 3 数据的四分位数 箱线图:箱线图是一种用来反映一组数据的整体分布情况的统计图,特别适用于多组数据的分布情况的比较,其中包含了最小值、最大值和四分位数信息.箱线图的两种常见形式如上图所示. 知识结构 考点精讲 典例专练 反馈练习 回顾反思 九年级某小组的8名同学每分钟跳绳的个数分别为165,182,136,112,145,171,155,93.这组数据的第一四分位数是( ) A.102.5 B.168 C.124 D.150 解:将原数据从小到大排序得:93,112,136,145,155,165,171,182, ∵总共有8个数据,第一四分位数是前4个数据的中位数,前4个数据为93,112,136,145, ∴第一四分位数是 . 知识结构 考点精讲 典例专练 反馈练习 回顾反思 学校体育检测中,记录了男、女各10名学生1分钟跳绳的个数,绘制了箱线图(如图),下列说法错误的是 A.男生跳绳个数最多为208个 B.女生跳绳成绩更稳定 C.男生跳绳个数的平均数小于女生跳绳个数的平均数 D.男生跳绳个数的中位数小于女生跳绳个数的中位数 解:A、左侧箱线图最大值为208,故男生跳绳个数最多为208个,原说法正确; B、右侧箱线图(女生)的极差和四分位距均小于左侧(男生),女生成绩波动小,更稳定,故女生跳绳成绩更稳定,原说法正确; C、通过箱线图无法确定平均数,故不能得到男生跳绳个数的平均数小于女生跳绳个数的平均数,原说法错误. D、左侧箱线图中位数线低于右侧,故男生跳绳个数的中位数小于女生跳绳个数的中位数,原说法正确. 知识结构 考点精讲 典例专练 反馈练习 回顾反思 2026年央视春节联欢晚会中,多款智能机器人登台完成高难度武术与舞蹈协同表演.为检测机器人表演的动作稳定性,技术人员对两种型号机器人完成一次标准空翻动作的耗时(单位:秒)进行统计,抽取10台G1型号机器人,测得完成标准动作的耗时数据:1.23,1.18,1.26,1.31,1.24,1.19,1.28,1.22,1.25,1.30;H2型号机器人的耗时数据如箱线图所示. (1)求G1型号机器人耗时数据的下四分位数,中位数,上四分位数; (1)解:排序:1.18,1.19,1.22,1.23,1.24,1.25,1.26,1.28,1.30,1.31 中位数:共10个数据,取第5,6个数的平均值1.245(秒), 下四分位数:取前5个数的中位数,即第3个数为1.22(秒), 上四分位数:取后5个数的中位数,即第8个数为1.28(秒); 知识结构 考点精讲 典例专练 反馈练习 回顾反思 (2)根据上述信息,比较两种型号机器人完成动作的稳定性,并说明理由. (2)解:①集中趋势对比: G1型号中位数为1.245秒,H2型号中位数为1.24秒,两者数值非常接近,说明两款机器人完成动作的平均耗时水平相当. ②离散程度对比: G1型号:上四分位数与下四分位数的差(箱体的高度)=1.28-1.22=0.06秒,极差0.13, H2型号:上四分位数与下四分位数的差(箱体的高度)=1.27-1.21=0.06秒,极差0.17, 两款机器人的上四分位数与下四分位数的差相同,说明中间50%数据的波动程度一致;但型号的极差更小,说明整体数据的离散程度更低,G1型号机器人的动作耗时更稳定. 知识结构 考点精讲 典例专练 反馈练习 回顾反思 针对练习 详解 样本数据5,9,1,3,7,6,10的Q3是________. 解:将样本数据从小到大排列,得1,3,5,6,7,9,10, 样本容量n=7,计算分位数位置 因为i不是整数,将i向上取整,得6,即该75%分位数为排序后第6个数据 故该样本的Q3为9. 知识结构 考点精讲 典例专练 反馈练习 回顾反思 针对练习 详解 在一次体检中,测得某校八年级(1)班第一组同学的体重(单位:kg)分别为50,55,58,57,54,50,56,60.该组同学体重的上四分位数是______,离差平方和是______. 解:将数据从小到大排序得:50,50,54,55,56,57,58,60, 数据共8个,上四分位数为75%分位数, 计算位置得 ,i为整数, 因此上四分位数为第6项与第7项的平均数,即 , 计算数据的平均数: , 离差平方和= =90. 知识结构 考点精讲 典例专练 反馈练习 回顾反思 考点 4 数据的分组 1.一般地,设有 n 个数据 x1,x2,…,xn,其平均数记为 ,则离差平方和为 d2=(x1 )2+(x2 )2+…+(xn )2=d21+d22+m(1-)2+(n-m)(2-)2. 2.其中d²1+d²2称为组内离差平方和,表示两个组内数据的离散程度;记 d²12=m(1-)2+(n-m)(2-)2, d²12是m个第一组数据平均数、(n-m)个第二组数据平均数关于总体数据平均数的离差平方和,称为组间离差平方和,表示两个组间的差异.根据组内离差平方和最小的原则进行分组时,由于d²不变,既可以按d²1+d²2最小来分组,也可以按d²12最大来分组. 知识结构 考点精讲 典例专练 反馈练习 回顾反思 某小组8名学生的数学考试成绩(单位:分)分别为88,98,87,92,92,90,91,96,老师决定将这些成绩分为两组,以便更好地分析学生的成绩分布.若按照以下分组方式:第一组 ,第二组 ,则组内离差平方和为__. 解:第一组数据的平均数为: 第一组数据的离差平方和为: 第二组数据的平均数为: 第二组数据的离差平方和为: 所以组内离差平方和为 故答案为:24. 知识结构 考点精讲 典例专练 反馈练习 回顾反思 某校舞蹈队共10名学生,测量并获取了所有学生的身高(单位:cm),数据整理如下:161,162,162,163,166,168,168,168,169,169. (1)上述数据中,中位数为__________,众数为__________. (2)通常组内学生身高越整齐则认为该组舞台呈现效果越好,按照“组内离差平方和最小”的方法,将学生按身高分为两组.嘉嘉和琪琪的分组方法如下: 嘉嘉的分组方法: 甲组学生的身高:161,162,162,163,166; 乙组学生的身高:168,168,168,169,169. 琪琪的分组方法: 甲组学生的身高:161,162,162,163; 乙组学生的身高:166,168,168,168,169,169. 请通过计算,比较嘉嘉和琪琪谁的分组方法更好. 知识结构 考点精讲 典例专练 反馈练习 回顾反思 (1)解:由题意得:中位数 168出现的次数最多,有3次,众数是168, 故答案为:167,168. 知识结构 考点精讲 典例专练 反馈练习 回顾反思 (2)解:嘉嘉的分组方法:甲组学生身高的平均值为 乙组学生身高的平均值为 组内离差平方和为 琪琪的分组方法:甲组学生身高的平均值为 乙组学生身高的平均值为 组内离差平方和为 ,琪琪的分组方法更好. 知识结构 考点精讲 典例专练 反馈练习 回顾反思 针对练习 详解 序号 ① ② ③ 分组情况 第一组1个,第二组3个 第一组2个,第二组2个 第一组3个,第二组1个 组内离差平方和 44 28 16.67 学校种植园中有4盆相同品种的植物,需要按植物的株高分成两组进行培养,使得同组内植物株高尽量接近,将4盆植 解:由题意可知,要使同组内植物株高尽量接近,需选择组内离差平方和最小的分组. 比较表格中三组的组内离差平方和,得 , 因此序号③的组内离差平方和最小,为最优分组. 物的株高从小到大排序后分成两组,共有3种情况,计算它们的组内离差平方和结果如下表所示,则4盆植物的最优分组序号是___________. 知识结构 考点精讲 典例专练 反馈练习 回顾反思 通过下列问题,请你反思是否掌握本章内容: 平均数、中位数、众数在刻画数据的集中趋势上各有什么特点? 平均数与加权平均数有什么联系和区别?举例说明加权平均数中“权”的作用. 离差平方和、方差在刻画数据离散程度上各有什么特点? 为什么四分位数和箱线图可以帮助我们了解数据分布的概貌? 对数据进行分组,除了按组内离差平方和最小分组,你还能想出其他分组的原则吗? 搜集关于“统计学”方面的资料(如学科发展史、思想方法、人物等),自选一个角度谈谈你对统计的认识.