内容正文:
高效作业15[第15课 常用表格数据的处理]
(见学生用书P160)
【A级 新教材落实与巩固】
1.小张合并商品购买表和用户信息表得到新数据集,部分数据如下图所示。现要分析不同年龄、性别的用户购买商品种类、数量的情况。分析前,小张对数据进行了以下整理,下列操作恰当的是( B )
①删除“birthday”列数据
②删除“电话”列数据
③删除“购买日期”列数据
④修改“user_id”“birthday”两列名称为中文名称
⑤修改单元格D6中的数据为M
⑥修改“birthday”列日期格式,使其与G列一致
A.①②③⑤ B.②④⑤⑥
C.①④⑤⑥ D.③④⑤⑥
【解析】 整理数据前要先明确此次数据分析的目的,选取满足分析的必要字段,确保数据集中的数据正确、规范、一致。删除“birthday”或“购买日期”列数据后将无法确定客户购买商品时的年龄信息,影响本次数据分析,因此①③的操作不恰当,选项B正确。
2.下列关于数据整理的说法中,不正确的是( D )
A.对缺失的数据可以采用概率统计值来填充
B.对重复的数据可以进行合并处理
C.数据集中的异常数据可能包含重要信息
D.数据集中的逻辑错误数据可以统一转换
【解析】 格式不同时,可以统一转换,选项D错误。
3.下列关于数据整理的说法中,不正确的是( A )
A.数据缺失一般用任意值进行填充
B.小明的生日为“2022——11——31”, 该生日数据存在逻辑错误
C.对于重复数据,可以在进一步审核的基础上进行合并或删除等处理
D.某中学学籍管理平台显示小红的年龄为“1岁”, 该年龄数据为异常数据
【解析】 数据缺失,一般采用平均值、中间值或概率统计值来填充缺失值,选项A错误。
4.小明发现“xm”列数据是混杂数据,他就利用Python 语言编程将此列数据的姓名和班级分别提取,再存储到新的Excel 文件进行数据整理。下列说法正确的是( D )
A.如果表格中出现数据缺失,可以直接删除
B.通过公式统计每班学习人数属于数据整理
C.数据整理的目的是共享数据资源
D.进一步审核后可以对重复的数据进行删除
【解析】 选项A,数据缺失,最简单的处理方法是忽略含有缺失值的实例或属性,还可以采用平均值、中间值或概率统计值来填充缺失值,选项错误;选项B,通过公式统计每班学习人数不属于数据整理,选项错误;选项C,数据整理的目的:检测和修正错漏的数据、整合数据资源、规整数据格式、提高数据质量,选项错误。
5.下面的表格数据中,“日期”列可能存在的数据问题是( D )
A.数据缺失 B.数据异常
C.逻辑错误 D.数据格式不一致
【解析】 2023-3-3与2023/3/4存在格式不一致的问题,选项D正确。
6.2024·瑞安中学检测[多选]近期某校进行了一次技术学考模拟考试,王老师将各班级的部分学生数据录入了“考试成绩.xlsx”文件中。下列关于“考试成绩.xlsx”文件中数据存在的问题以及对应的解决方式中,正确的是( AC )
A.数据重复→应在进一步审核的基础上进行合并或删除等处理
B.数据缺失→复制上一条数据记录中的数据
C.格式不一致→进行数据转换,形成统一的格式
D.逻辑错误→再次访问数据源,验证数据是否正确
【解析】 选项B,数据缺失,最简单的处理方法是忽略含有缺失值的实例或属性,还可以采用平均值、中间值或概率统计值来填充缺失值,选项错误;选项D,逻辑错误,通过检测字段中各属性有效数值的范围来验证数据是否正确,选项错误。
7.某校抽取八名学生进行体质测试,使用Excel软件对测试结果进行处理,如图1所示。下列说法不正确的是( B )
图1
图2
A.Excel为微软推出的电子表格软件,可以进行数据的处理、统计分析和辅助决策操作
B.体质指数BMI=体重(kg)÷身高的平方(m2),沈嘉怡的BMI计算公式为“=G2/(F2*F2)*0.0001”
C.在G10单元格中输入公式“=AVERAGE(G2:G9)”,可计算这八名学生的平均体重
D.通过数据源“B1:B9,F1:F9”建立图2所示的柱形图,能直观地反映这八名学生身高的差异
【解析】 BMI计算公式为“=G2/(F2*F2)*10000”,选项B错误。
8.小明查看了近十年按年龄分类的人口调查抽样样本数据,并用Excel软件对数据进行处理,如图1所示。请回答下列问题。
(1)下列关于数据整理的说法中,正确的是__ABC__(多选,填字母)。
A. 异常数据指数据集中不符合一般规律的数据对象
B.对于重复数据,可以在进一步审核的基础上进行合并或删除等处理
C.某人的生日为“2022-2-30”,该生日数据存在逻辑错误
D.数据集中格式不一致的数据,一般保留一种格式的数据,删除其他格式的数据
(2)区域B16:I16的数据是通过公式计算得到。用SUM函数将B16中的公式修改为__=SUM(B10:B15)/B2__,并用自动填充功能完成C16:I16的计重。
(3)图2是根据图1 中的数据制作的图表,创建该图表的数据区域是__B1:I1,B16:I16__。
(4)观察图2,根据图3中的提示选出图2中设置的图表元素:__①②③__(选填序号:①/②/③/④)。
图1
图2
【解析】 (1)当数据的格式不一致时,一般保留一种格式的数据,并将其他格式的数据转换为统一格式,选项D错误。
(2)使用SUM()函数计算。
(3)选择第1行和第16行为数据区域,其他没有图例,第1列不需要选择。
(4)图2中没有图例。
【B级 素养形成与评价】
9.小明收集了某中学两个班级体质健康测试的数据,并将部分项目数据用Excel软件进行数据处理,如图1所示。请回答下列问题。
图1
(1)区域G3:G82的数据是通过公式计算得到的,在G3单元格中输入公式__=D3/(C3*C3)*10000或=D3/C3^2*10000或其他等价答案__,再使用自动填充功能完成区域G4:G82的计算。(提示:体质指数=体重/身高2,单位:kg/m2)
(2)对区域A2:G82进行相关数据分析,下列说法正确的是__AC__(多选,填字母)。
A.更新C列身高数据,G列体质指数的值会随之改变
B.为了将女生身高最高的数据显示在当前工作表的第3行,可选择“身高”为主要关键字、“性别”为次要关键字,均按降序排序
C.为了显示男生1000/800 m得分大于85的数据,可先对“性别”进行筛选,选择的值为“男”,再对“1000/800 m得分”进行筛选,条件为“大于85”
D.为了显示女生肺活量得分最高的3名学生数据,可先对“性别”进行筛选,选择的值为“女”,再对“肺活量得分”进行筛选,打开“自动筛选前10个”功能,选择“显示最大3项”
(3)对图1中的数据进行相关统计,结果放在新工作表中,如图2所示。图3是根据图2中的数据制作的图表。创建该图表的数据区域是__A2:A6,D2:E6__。
图2
图3
【解析】 (1)直接根据提示信息书写公式,书写方式比较多,等价表达式均可。特别注意厘米与米的单位换算。
(2)选项A,G列数据由包含C列单元格的公式计算得到,故更新C列数据,G列的值会随之改变。选项B,身高为主要关键字降序,则身高最高的同学(不管男女)会被排在最前面,只有身高相同才会按次要关键字“性别”降序。主、次要关键字交换,才能实现题目要求。选项C,多种筛选条件,分步对每个条件进行单独筛选,各自筛选结果的交集,即是筛选的最终结果。选项D,分析同选项C,需要注意的是,后续筛选仍然是对整列而非上一筛选结果进行的。该选项的操作结果是“既是女生,肺活量又排在全体前三”,而非“女生中肺活量排名前三”。如果肺活量得分前三全是男生,则该操作筛选结果为0条数据。
(3)根据图表横坐标和图例即可写出数据区域。特别注意每列单元格数量要一致,不要漏掉A2。
10.2024·余姚中学检测某同学收集某书店销售及库存的统计数据,使用Excel软件处理,如图1 所示。每本书对应一个唯一的书名编码,请回答下列问题。
图1
(1)根据“销售清单”每本书的销售数量,计算销售小计。先在H3 单元格计算“书名编码”是“A”的销量小计,并将公式自动填充到H8 单元格。则H3 单元格的公式是__=SUMIF($A$3:$A$9,G3,$C$3:$C$9)或=SUMIF(A$3:A$9,G3,C$3:C$9)____。
(提示:SUMIF() 函数用于对区域中满足条件的单元格求和,例如,“=SUMIF(B3:B9,B3,E3:E9)”表示区域B3:B9 中“书名”是“《量子力学》”的所有“小计”的和)
(2)H8 单元格显示的结果是__C__(单选,填字母:A.#DIV/0!;B.#VALUE!;C.0 )。
(3)图2是根据图1 中的数据制作的图表,下列说法正确的是__BD__(多选,填字母)。
图2
A.创建该图表的数据区域是G5:H7
B.将图1“销售清单”中第9 行的书名编码“D”改为“A”,则图表会随之变化
C.对图1“销售清单”中的数据区域A2:E9 进行排序,则图表会随之变化
D.删除图1工作表中书名编码是“A”所在的第3 行,则图表不会随之变化
【解析】 (1)根据“销售清单”中每本书的销售数量,计算销售小计。先在H3 单元格计算“书名编码”是“A”的销量小计,并将公式自动填充到H8 单元格,则H3 单元格的公式在使用SUMIF函数时,第1 个参数和第3个参数需保证行不变
(2)H8 单元格的公式为“=SUMIF($A$3:$A$9,G3,$C$3:$C$9)”或“=SUMIF(A$3:A$9,G3,C$3:C$9)”,查找的书名编码为“F”,在A3:A9中没有书名编码为“F”的书,故H8 单元格显示的结果是0。
(3)选项A,创建该图表的数据区域是G2:H2,G5:H7,选项错误;选项B,将图1“销售清单”中第9 行的书名编码“D”改为“A”,书名编码“A”的书籍会增加,则图表会随之变化,选项正确;选项C,对图1“销售清单”中的数据区域A2:E9 进行排序,图表只是统计书籍C、D、E 的数量,则图表是不会随之变化的,选项错误;选项D,删除图1工作表中书名编码是“A”所在的第3 行,而图表只是统计书籍C、D、E 的数量,图表不会随之变化,选项正确。
11.2024·苍南中学检测某中学举行艺术比赛,并使用Excel 软件进行数据处理,如图所示。请回答下列问题。
(1)J3 计算的是歌唱类“内容取材”项目得分的平均分,将J3 单元格中的公式向下自动填充至单元格J5,再将区域J3:J5 中的公式向右填充至L 列,从而正确计算出J3:L5 区域内的数据,则J3 单元格中的公式为__=AVERAGEIF($A$3:$A$15,$I3,D$3:D$15)__。
(提示:AVERAGEIF() 函数用于返回某个区域内满足给定条件的所有单元格的算术平均值。例如,“=AVERAGEIF(A3:A15,I4,G3:G15)”用于计算“器乐类”的“总分”平均分)
(2)制作图表,呈现5012 号选手“内容取材”“专业水平”“舞台表现”3项得分分别占该选手总分的百分比,应制作的图表类型为__C__(单选, 填字母:A.柱形图;B.折线图;C.饼图)。
(3)要获取“器乐类”总分最高选手的报名号,下列操作可行的是__BD__(多选,填字母)。
A.按“总分”为主要关键字,“类别”为次要关键字,均按降序排序,选择“器乐类”中排最前面的报名号
B.按“类别”为主要关键字,“总分”为次要关键字,均按升序排序,选择“器乐类”中排最后面的报名号
C.以“类别”为“器乐类”进行筛选,再按“总分”最大的1 项进行筛选,选择其中的报名号
D.以“类别”为“器乐类”进行筛选,再按“总分”为主要关键字降序排序,选择排在最前面的报名号
【解析】 (1)考查相对引用和绝对引用。从题干中可以得出AVERAGEIF函数里有3个参数,前2个表示条件关系,后1个表示求和的总区域。由题干可知J3 里的条件要是类别为I3,要往下、往右拖,往右拖时列不变,往下拖时要变成I4,所以条件关系的前两项为$A$3:$A$15,$I3 最后参数表示的是求和项,往下拖时要求行不变,往右拖时要求列变,所以为D$3:D$15。
(2)折线图适合反映趋势;柱形图反映数据差异,适合需要数据比较的情况;饼图适用于部分占总体的比例,所以选择饼图。
(3)选项A,主次关键字,首先按主关键字排序,在主关键字相同的情况下再按次关键字排,所以排在前面的都是总分高的,如题干中的图所示,总分最高的是歌唱类26.7,所以不符合要求。选项B,相同类别的按总分升序,选择器乐类最后面的,符合要求。选项C,筛选是对所有记录进行的,包括显示和隐藏的,所以这样操作是选出既是总分最高又是器乐类的,不符合要求。选项D,对选出的器乐类进行降序,选取最前面的,符合要求。
学科网(北京)股份有限公司
$$