内容正文:
2026年高考信息技术专题复习——数据与大数据
一、知识点填空题
1. 数据是描述事物的______,是信息的______,在计算机科学中,数据是计算机______、______和______的对象,常见的表现形式有______、______、______、______等。
1. 信息是数据所表示的______,可以用来消除接收者某种认识上的______,信息量的大小可用______的多少来表示。
1. 信息的核心特征包括______、______、______、______,其中______指信息可复制传播且不耗损,______指信息价值因人而异。
1. 知识是人们在社会实践中获得的______和______的总和,是人类认识世界的成果,其形成需对信息进行______和______。
1. 数据、信息与知识的转化关系:数据经过______成为信息,信息经过______成为知识,知识升华为______。
1. 数字化是将事物属性或特征转化为______可处理对象的过程,核心是将______信号转换为______信号,其关键步骤包括______、______、______。
1. 模拟信号的波形是______的函数,数字信号的取值是______的,二者可通过特定设备相互转换。
1. 二进制的基数为______,基本数码是______和______,进位规则是______,1位八进制数可对应______位二进制数,1位十六进制数可对应______位二进制数。
1. 十进制整数转换为二进制数的方法是______,二进制数转换为十进制数的方法是______。
1. 计算机存储的基本单位是______(符号______),1个该单位等于______个二进制位(符号______),常用存储单位换算关系:1KB=______B,1MB=______KB,1GB=______MB。
1. 字符编码中,早期英文标准是______,国际通用字符集是______,我国现行强制性国家标准是______,互联网广泛使用的是______。
1. 声音数字化的三个核心步骤是______、______、______,其中______决定音频的保真度,______决定音频的精度。
1. 音频存储容量计算公式:______=采样频率×量化位数×声道数×时长/8。
1. 图像的基本组成单位是______,图像存储容量计算公式:______=水平像素数×垂直像素数×颜色深度/8,颜色深度为n位时,可表示______种颜色。
1. 视频由连续播放的______组成,当播放速度超过______帧/秒时,可形成流畅画面,常见视频格式有______、______、______。
1. 数据压缩分为______和______两类,其中______压缩后可完全还原原始数据,代表格式有______、______;______压缩会损失部分信息,代表格式有______、______、______。
1. 大数据的四大核心特征是______、______、______、______,其中______指数据体量巨大,______指数据生成速度快。
1. 大数据技术体系包括______、______、______、______、______等环节。
二、选择题
1. 下列选项中属于数据的是( )
A. 智能手机 B. 天气预报“明日有雨”
C. 学生成绩单上的85分 D. 《国家学生体质健康标准》
1. 关于数据与信息的关系,下列说法正确的是( )
A. 数据就是信息 B. 信息是数据的载体
C. 未经处理的数据无意义 D. 数据经过加工可转化为信息
1. 下列不属于信息特征的是( )
A. 依附性 B. 独占性 C. 时效性 D. 价值相对性
1. 十进制数37转换成二进制数的结果是( )
A. 100101 B. 101001 C. 110001 D. 100011
1. 计算机存储单位换算正确的是( )
A. 1TB=1024PB B. 1GB=1024×1024
C. 1MB=1024KB D. 1KB=1000B
1. 下列属于我国强制性字符编码标准的是( )
A. ASCII B. UTF-8 C. GB 18030-2005 D. Unicode
1. 声音数字化过程中,决定音频精度的是( )
A. 采样频率 B. 量化位数 C. 声道数 D. 时长
1. 某图像尺寸为800×600像素,颜色深度为24位,其存储容量约为( )
A. 1.37MB B. 137KB C. 1.41GB D. 141KB
1. 下列属于无损压缩格式的是( )
A. JPEG B. MP3 C. ZIP D. MPEG
1. 关于大数据特征,下列说法错误的是( )
A. 巨量性指数据体量极大 B. 多样性仅包括结构化数据
C. 迅变性要求数据快速处理 D. 价值性指数据蕴含潜在价值
1. 下列不属于数字化作用的是( )
A. 打破信息传播时空限制 B. 降低信息存储与传输效率
C. 推动行业变革 D. 支持个性化学习
1. 二进制数101101转换成十进制数的结果是( )
A. 45 B. 43 C. 47 D. 41
1. 下列关于字符编码的说法,正确的是( )
A. ASCII编码可表示所有汉字 B. UTF-8编码中汉字均为2字节
C. GB 18030-2005与GB 2312兼容 D. Unicode是具体的编码格式
1. 音频存储容量计算中,若采样频率为44.1kHz,量化位数为16位,双声道,时长3分钟,其存储容量约为( )
A. 15.8MB B. 30.3MB C. 63.2MB D. 7.9MB
1. 下列属于大数据应用的是( )
A. 个人计算机存储文件 B. 智能导航实时规划路线
C. 手动记录班级成绩 D. 单机版办公软件处理数据
1. 数字化的核心是将模拟信号转换为数字信号,其关键步骤不包括( )
A. 采样 B. 量化 C. 编码 D. 压缩
1. 关于图像存储容量,下列说法正确的是( )
A. 颜色深度越大,存储容量越小 B. 像素数越多,存储容量越大
C. 图像格式不影响存储容量 D. 黑白图像颜色深度为8位
1. 下列不属于大数据技术的是( )
A. 数据采集 B. 数据预处理 C. 单机数据存储 D. 数据可视化
1. 信息的时效性体现在( )
A. 同一信息对不同人价值不同 B. 新闻报道需及时发布
C. 信息可通过网络共享 D. 书籍通过文字记录历史
1. 数据压缩的主要目的是( )
A. 增加数据精度 B. 减少存储空间和传输时间
C. 提高数据安全性 D. 增强数据可读性
三、简答题
1. 简述数据、信息与知识的区别与联系。
1. 简述数字化的意义及对生活的影响。
1. 列举三种常见的数据编码类型,并说明其核心作用。
1. 简述大数据的特征及在医疗健康领域的应用。
四、计算题
1. 计算下列数制转换:
(1) 将十进制数49转换为二进制数;
(2) 将二进制数110101转换成十进制数;
(3) 将十六进制数#FF6600转换为RGB颜色值。
1. 计算下列存储容量:
(1) 一首时长4分钟的双声道音乐,采样频率为44.1kHz,量化位数为16位,求其存储容量(单位:MB);
(2) 一幅尺寸为1024×768像素,颜色深度为24位的BMP图像,求其存储容量(单位:MB)。
五、实践应用题
某班级开展“体质数据促健康”项目,收集到5名学生的体质数据如下表:
序号
姓名
性别
身高/cm
体重/kg
肺活量/mL
50米跑/s
1
张三
男
178
68
4200
7.2
2
李四
男
165
52
3800
8.1
3
王五
女
162
48
3200
8.5
4
赵六
男
183
82
4500
6.9
5
孙七
女
158
45
3000
9.0
已知高一男生正常BMI范围为16.5~23.2,女生为16.5~22.7,BMI<16.4为低体重,23.3~26.3(男)/22.8~25.2(女)为超重,≥26.4(男)/≥25.3(女)为肥胖。 请完成以下任务:
1. 计算5名学生的BMI值(保留2位小数);
1. 判断每名学生的BMI等级;
1. 结合大数据特征,说明如何利用体质数据为班级制定个性化健身方案。
参考答案及解析
一、知识点填空题
1. 符号记录;载体;识别;存储;加工;字符;图像;音频;视频
1. 意义;不确定性;消除不确定性
1. 依附性;共享性;时效性;价值相对性;共享性;价值相对性
1. 认识;经验;提炼;归纳
1. 处理;提炼归纳;智慧
1. 计算机;模拟;数字;采样;量化;编码
1. 时间连续;离散不连续
1. 2;0;1;逢二进一;3;4
1. 除2反向取余法;按权展开求和法
1. 字节;B;8;bit;1024;1024;1024
1. ASCII;Unicode;GB 18030-2005;UTF-8
1. 采样;量化;编码;采样频率;量化位数
1. 音频存储容量
1. 像素;图像存储容量;2ⁿ
1. 帧;24;AVI;WMV;MP4
1. 无损压缩;有损压缩;无损;ZIP;7Z;有损;MP3;JPEG;MPEG
1. 巨量性;多样性;迅变性;价值性;巨量性;迅变性
1. 大数据采集;大数据预处理;大数据存储与管理;大数据分析与挖掘;大数据可视化与应用
二、选择题
1. 答案:C
解析:数据是描述事物的符号记录,C选项的85分是具体数据;A是设备,B是信息,D是知识。
1. 答案:D
解析:数据是信息的载体,信息是数据的意义,数据经过加工处理可转化为信息,A、B错误;原始数据也可能有潜在意义,C错误。
1. 答案:B
解析:信息具有共享性,无独占性,A、C、D均为信息核心特征。
1. 答案:A
解析:37÷2=18余1,18÷2=9余0,9÷2=4余1,4÷2=2余0,2÷2=1余0,1÷2=0余1,反向取余得100101。
1. 答案:C
解析:正确换算关系为1TB=1024GB,1GB=1024MB=1024×1024KB,1KB=1024B,故选C。
1. 答案:C
解析:GB 18030-2005是我国现行强制性字符编码标准,A是早期英文标准,B是互联网常用编码,D是字符集。
1. 答案:B
解析:量化位数越多,量化值越接近采样值,音频精度越高;采样频率影响保真度。
1. 答案:A
解析:800×600×24/8=1440000B,1440000÷1024≈1406.25KB,1406.25÷1024≈1.37MB。
1. 答案:C
解析:ZIP是无损压缩格式,A、B、D均为有损压缩格式。
1. 答案:B
解析:大数据的多样性包括结构化数据、半结构化数据(如网页)、非结构化数据(如音视频),B错误。
1. 答案:B
解析:数字化提高信息存储与传输效率,B不属于其作用。
1. 答案:A
解析:1×2⁵+0×2⁴+1×2³+1×2²+0×2¹+1×2⁰=32+8+4+1=45。
1. 答案:C
解析:ASCII编码仅能表示英文字母和数字,A错误;UTF-8中常用汉字为3字节,B错误;Unicode是字符集,非编码格式,D错误。
1. 答案:B
解析:44100×16×2×180/8=31752000B,31752000÷1024÷1024≈30.3MB。
1. 答案:B
解析:智能导航利用实时交通大数据规划路线,属于大数据应用;A、C、D均为传统数据处理。
1. 答案:D
解析:数字化关键步骤为采样、量化、编码,压缩是后续优化步骤,不属于核心转化步骤。
1. 答案:B
解析:图像存储容量与像素数、颜色深度正相关,A错误;格式影响压缩比,进而影响存储容量,C错误;黑白图像颜色深度为1位,1位表示2种颜色(黑/白),D错误。
1. 答案:C
解析:大数据存储采用云存储和分布式管理,单机存储不属于大数据技术。
1. 答案:B
解析:时效性指信息随时间变化可能失效,新闻需及时发布体现时效性。
1. 答案:B
解析:数据压缩的核心目的是减少存储空间占用和缩短传输时间,A、C、D均非主要目的。
三、简答题
1. 答案:
· 区别:数据是描述事物的符号记录(如原始数字、字符),是客观原始材料;信息是数据经过处理后的有意义内容(如分析结果),能消除不确定性;知识是对信息的提炼归纳(如规律、方法),是解决问题的能力。
· 联系:数据是信息的载体,信息是数据的意义;数据经加工成信息,信息经提炼成知识;知识应用可产生新数据和信息,形成循环。
1. 答案:
· 意义:将复杂信息转化为计算机可处理的数字信号,实现信息的高效存储、传输和共享,为信息技术应用奠定基础。
· 影响:改变生活方式(如在线购物、远程医疗)、学习方式(如数字图书馆、在线学习)、工作方式(如远程办公、数字化生产);推动各行业变革,促进社会进步。
1. 答案:
· 字符编码:将字符转换为计算机可识别的二进制数据,核心作用是实现人与计算机的字符交互,如ASCII、GB 18030-2005。
· 声音编码:将声波模拟信号转换为数字信号,核心作用是实现声音的数字化存储和播放,关键步骤为采样、量化、编码。
· 图像编码:将图像像素信息转换为二进制数据,核心作用是实现图像的数字化存储和传输,需记录像素颜色和位置信息。
1. 答案:
· 特征:巨量性(数据体量巨大)、多样性(数据类型繁多)、迅变性(生成速度快、需快速处理)、价值性(蕴含潜在价值但价值密度低)。
· 医疗健康应用:通过可穿戴设备采集生理数据,监测健康状况;利用大数据分析病例,辅助疾病诊断;基于基因大数据研究疾病成因;实现疫情实时监测与预测。
四、计算题
1. 答案:
(1) 十进制49转换为二进制:除2反向取余法,49÷2=24余1,24÷2=12余0,12÷2=6余0,6÷2=3余0,3÷2=1余1,1÷2=0余1,反向取余得110001,即(49)₁₀=(110001)₂;
(2) 二进制110101转换为十进制:1×2⁵+1×2⁴+0×2³+1×2²+0×2¹+1×2⁰=32+16+4+1=53,即(110101)₂=(53)₁₀;
(3) 十六进制#FF6600转换为RGB:FF对应十进制255,66对应102,00对应0,故RGB(255,102,0)。
1. 答案:
(1)音频存储容量:44100×16×2×240/8=42336000B,42336000÷1024÷1024≈40.4MB;
(2)图像存储容量:1024×768×24/8=2359296B,2359296÷1024÷1024≈2.25MB。
五、实践应用题
1. 答案:
· 张三:BMI=68÷(1.78×1.78)=68÷3.1684≈21.46;
· 李四:BMI=52÷(1.65×1.65)=52÷2.7225≈19.10;
· 王五:BMI=48÷(1.62×1.62)=48÷2.6244≈18.29;
· 赵六:BMI=82÷(1.83×1.83)=82÷3.3489≈24.49;
· 孙七:BMI=45÷(1.58×1.58)=45÷2.4964≈18.03。
1. 答案:
· 张三(男):16.5~23.2,正常;
· 李四(男):16.5~23.2,正常;
· 王五(女):16.5~22.7,正常;
· 赵六(男):23.3~26.3,超重;
· 孙七(女):16.5~22.7,正常。
1. 答案:
· 巨量性:收集班级所有学生长期体质数据(如每日运动、饮食、睡眠数据),实现全样本分析,精准把握整体体质状况;
· 多样性:整合BMI、肺活量、运动成绩等多类型数据,全面评估学生身体机能和素质;
· 迅变性:实时更新学生体质数据,及时调整健身方案(如根据近期50米跑成绩优化速度训练);
· 价值性:挖掘数据关联(如肺活量与长跑成绩的关系),为超重学生制定减脂计划,为体能薄弱学生设计针对性训练,实现个性化健身指导。
学科网(北京)股份有限公司
$