内容正文:
粤教版(2019)高中信息技术必修一《数据与计算》综合复习知识梳理
第一章 数据与信息
一、数据
1. 数据的概念
数据是现实世界客观事物的符号记录,是信息的载体,是计算机加工的对象。数据是对所有输入计算机并被计算机识别、存储和处理的符号的总称,是联系现实世界和计算机世界的途径。现实世界的各种符号都可以被计算机转化为二进制数。例如图形、图像、视频、音频、文本等都属于数据形式。
2. 数据的基本特征
二进制:在计算机中,数据以二进制的形式存储、加工。
语义性:语义是将数据符号解释为客观世界的事物。
分散性:数据是分散的记录,分别记录不同客观事物的运动状态。
多样性与感知性:数据记录的形式是多样的、可看的、可听的、可感知的,如图形、图像、视频、音频、文本等。
二、数据编码
1. 模拟信号与数字信号
模拟信号:指用连续变化的物理量所表达的信息,如有线电视、无线广播等。优点:直观易实现;缺点:保密性差、抗干扰能力弱。
数字信号:是离散时间信号的数字化表示,如电流脉冲。优点:抗干扰强、可靠性高;缺点:算法复杂、成本高。
数据基本上是通过编码将模拟信号转换为数字信号进行存储和传输,文字、图像、声音等类型的数据都可经过编码进行存储和传输。
2. 编码的基本方式
① 文字编码
单字节码:ASCII码、莫尔斯码。ASCII码由8位二进制码组成,可表示128个字符;ASCII码中大小写字母间相差32,A的编码是01000001(65),a的编码是01100001(97)。
双字节码:国标码(GBK)、统一码(Unicode)。
② 图像编码
图像编码是指对图像数据进行变换、编码和压缩。位图(Bitmap)也叫做点阵图(或像素图),最小单位为光栅点(像素)。
位图文件大小(B)= 文件头(14B)+ 信息头(40B)+ 颜色表项 + 图像分辨率 × 图像量化位数 ÷ 8。
位图与矢量图对比:
位图:以像素为最小单位,放大后会失真模糊,适合照片、截图等,文件格式有png、jpg、bmp、gif等。
矢量图:以数学向量(线条/形状)为最小单位,放大不失真,适合Logo、工程图等,文件格式有ai、dwg、cdr等。
③ 声音编码
声音编码必须经过前期的数据采样和数据量化。步骤:采样、量化、编码。
声音存储空间 = 采样频率 × 量化位数 × 声道数 × 时间 ÷ 8。
三、信息
1. 信息的概念
信息是经过加工处理的、具有意义的数据,在人类社会活动中发挥着重要作用。
数据与信息的关系:数据是信息的原料,信息是数据的价值体现,数据经过加工处理才能成为有价值的信息。例如“36.5℃”只是一个数据,而“体温36.5℃”才具有信息意义。
2. 信息的基本特征
普遍性:只要有事物运动,有数据存在,就会有信息存在。
传递性:信息可以突破时空限制进行传递。
共享性:信息可以被多个信息接受者接收并且多次使用,且不损耗。
依附性和可处理性:信息不能独立存在,需要依附于一定的载体;信息可以转换成不同的载体形式而被存储和传播。
时效性:信息随事物变化可能失效。
真伪性:信息可能与事实不符。
价值相对性:同一个信息对不同人的价值可能不同。
第二章 知识与数字化学习
一、知识与智慧
1. 知识的获取途径
发现知识的途径:做实验 → 获取观察数据 → 分析处理数据 → 推理建立数学模型 → 实验验证模型 → 形成知识 → 应用知识解决问题。
2. 知识、信息、数据、智慧的关系
知识:人们运用大脑对获取或积累的信息进行系统化地提炼、研究和分析的结果,能够精确地反映事物的本质。知识是结构化的信息。
智慧:智慧是为了达到预定目标而运用知识解决问题的创新思维能力。
数据、信息、知识和智慧是逐层递进的概念,前者是后者的基础和前提,后者是前者的抽象与升华。
3. 科学研究的方法
理论方法:以数学学科为代表
实验方法:以物理学科为代表
计算方法:利用计算工具
二、数字化学习与创新
1. 数字化工具
数字化工具是能够采集、获取、检索、表示、传输、存储和加工多媒体数字化资源的设备装置。按其功能不同可大致分为:
数据采集(模数转换)工具:声卡、视频卡、数码照相机、数码录像机、手写板、扫描仪等
信息获取工具:台式电脑、笔记本电脑、平板电脑、手机等
信息检索工具:搜索引擎、电子词典等
数字化可视化表达工具:思维导图、演示文稿等
信息通信交流与传输工具:社交软件等
信息加工工具:编程软件等
三维设计工具:3DMax等
存储工具:U盘等
2. 数字化资源的特点
便捷性、多样性、共享性、互动性、扩展性。
第三章 算法基础
一、体验计算机解决问题的过程
1. 人工解决问题的过程
明确问题给出的条件 → 根据经验和知识确定解决问题的方法 → 解决问题。当数据量较多时,人工处理效率很低。例如,列出从A市经中转站到B市的全部交通组合,手工计算耗时量大。
2. 计算机解决问题的过程
计算机解决问题的过程可分为四个步骤:分析问题 → 设计算法 → 编写程序 → 调试运行程序。
具体来说:
分析问题:提取问题需求情况和已知条件,搞清楚需要解决的问题。
设计算法:给出计算机解决问题的详细方法和步骤。
编写程序:选择一种计算机语言工具来编写程序,实现算法。
调试运行程序:检验程序执行效果,若出错则根据提示修改程序,重新调试运行。
二、算法及其描述
1. 算法的概念与特征
算法是解决问题的明确的指令集合,是计算机程序设计的基础。其基本特征包括:有穷性、确定性、可行性、有输入、有输出。
2. 算法的描述方法
自然语言:用人类日常语言描述算法步骤,直观易懂但可能存在歧义。
流程图:用图形符号表示算法流程,清晰直观。
伪代码:介于自然语言和程序设计语言之间的描述方式,便于过渡到实际编程。
3. 算法的三种基本控制结构
顺序结构、选择结构(分支结构)、循环结构。
第四章 程序设计基础
一、程序设计语言的基础知识(以Python为例)
1. 常量与变量
常量是程序运行过程中值不发生改变的量;变量是程序运行过程中值可以发生改变的量,用于存储数据。
2. 数据类型
Python常用的基本数据类型包括:整型(int)、浮点型(float)、字符串型(str)、布尔型(bool)。
3. 运算符与表达式
算术运算符:+(加)、(减)、*(乘)、/(除)、//(整除)、%(取余)、**(幂)
关系运算符:==、!=、>、<、>=、<=
逻辑运算符:and(与)、or(或)、not(非)
赋值运算符:=、+=、=、*=等
4. 函数
Python内置函数如print()、input()、len()、range()、type()等;也可自定义函数。
一、输入输出函数
函数
功能说明
示例
print()
输出内容到控制台
print("Hello") 输出 Hello
input()
从键盘读取用户输入(返回字符串)
name = input("请输入姓名:")
注意:input() 返回的一定是字符串类型,若需要整数或浮点数,必须用 int() 或 float() 转换。
二、数据类型转换函数
函数
功能说明
示例
int(x)
将 x 转换为整数
int("123") → 123;int(3.14) → 3
float(x)
将 x 转换为浮点数
float("3.14") → 3.14;float(5) → 5.0
str(x)
将 x 转换为字符串
str(123) → "123";str(3.14) → "3.14"
list(x)
将可迭代对象转换为列表
list("abc") → ['a','b','c']
abs(x)
返回 x 的绝对值
abs(-5) → 5
max(x)
返回最大值
max(3, 5, 1) → 5;max([2,4,6]) → 6
min(x)
返回最小值
min(3, 5, 1) → 1
sum(x)
返回可迭代对象中所有元素的和
sum([1,2,3,4]) → 10
len(x)
返回对象(字符串、列表、元组、字典等)的长度
len("Python") → 6;len([1,2,3]) → 3
range(start, stop, step)
生成一个整数序列(常用于循环)
range(5) → 0,1,2,3,4;range(2,8,2) → 2,4,6
二、三种基本结构
1. 顺序结构
程序按代码书写的顺序依次执行。数据的输入(input())和输出(print())是顺序结构的基本操作。
2. 选择结构(分支结构)
(1) if语句:单分支选择
语法格式
if 条件表达式:
语句块
注意事项:
· 如果条件为 True,执行语句块;否则跳过。
· 语句块必须缩进(通常 4 个空格),表示属于 if 的代码范围。
(2) if…else语句:双分支选择
语法格式
if 条件表达式:
语句块1
else:
语句块2
注意事项:
· 条件为 True 执行语句块1,为 False 执行语句块2。
(3) if…elif…else语句:多分支选择
语法格式:
if 条件1:
语句块1
elif 条件2:
语句块2
elif 条件3:
语句块3
...
else:
语句块n # 所有条件都不满足时执行
注意事项:
· 从上到下依次判断,一旦某个条件为 True,执行对应语句块后跳出整个结构,不再判断后续条件。
· else 部分可选。
3. 循环结构
(1)for循环:适用于已知循环次数的情况,常与range()函数配合使用
语法格式:
for 变量 in 可迭代对象:
循环体语句块
· 可迭代对象:字符串、列表、元组、字典、range() 函数返回的序列等。
· 每次迭代,变量 依次取可迭代对象中的每个元素,执行一次循环体。
示例:
for i in range(5): # 0,1,2,3,4
print(i)
for i in range(2, 8): # 2,3,4,5,6,7
print(i)
for i in range(1, 10, 2): # 1,3,5,7,9
print(i)
(2) while循环:适用于条件控制循环的情况
语法格式:
while 条件表达式:
循环体语句块
· 每次循环前判断条件,若为 True 则执行循环体,否则退出。
· 必须确保循环条件最终会变为 False,否则形成无限循环。
(3)循环嵌套:循环内部包含其他循环
一个循环内部包含另一个循环,称为循环嵌套。常用于处理二维数据或需要多重遍历的场景。
示例:打印星号矩形
rows = 5
cols = 4
for i in range(rows): # 外层循环控制行数
for j in range(cols): # 内层循环控制每行星号个数
print("*", end="")
print() # 换行
(4)循环控制:break(跳出循环)、continue(跳过本次循环)
语句
作用
适用场景
break
立即终止整个循环,跳出循环体
已经找到目标,无需继续
continue
跳过本次循环剩余语句,进入下一次迭代
本次循环不符合条件,需要跳过
示例
# break:找到第一个偶数后立即停止
for i in range(1, 10):
if i % 2 == 0:
print("找到偶数:", i)
break
# continue:输出 1~10 中的所有奇数
for i in range(1, 11):
if i % 2 == 0:
continue
print(i)
第五章 数据处理和可视化表达
一、认识大数据
1. 大数据的概念与特征(4V特征)
大量(Volume) :数据体量巨大
多样(Variety) :数据类型繁多(结构化、半结构化、非结构化)
低价值密度(Value) :海量数据中真正有价值的信息所占比例小
高速(Velocity) :数据处理速度快,通常要求实时或近实时处理
2. 大数据对日常生活的影响
便捷性:支付、医疗等;同时带来隐私泄露等风险。
二、数据的采集
1. 数据采集的方法和工具
系统日志采集法:通过系统日志记录用户行为数据
网络数据采集法:通过网络爬虫或网站公开API获取网络信息
传感器采集法:通过传感器自动采集物理世界的数据
2. 数据的存储和保护
存储方式:本地存储、云存储
保护技术:数据拷贝、备份、镜像等
隐私保护:技术措施、安全意识、道德规范、法律法规
三、数据的分析
1. 特征探索
数据预处理:处理缺失值、异常数据;统计量分析:最大值、极差等。
2. 关联分析
发现数据之间的相关关系。典型应用如“购物篮分析”——购买方便面的顾客往往也会购买火腿肠、卤蛋等商品。关联分析在大数据时代尤为受重视,更加关注事物之间的相关性而非因果关系。
3. 聚类分析
将数据按相似度分组,同一组内的数据相似度高,不同组之间的数据相似度低。常用算法有KMeans聚类。
4. 数据分类
将数据分配到预定的类别中,需要先有训练数据建立分类模型。常用算法有贝叶斯分类。
四、数据的可视化表达
1. 数据可视化表达的方式
常用图表及其应用场景:
图表类型
主要应用场景
饼图
展示各部分在总体中的比例关系
折线图
展示数据随时间变化的趋势
条形图/柱状图
比较不同类别的数据大小
散点图
展示两个变量之间的相关关系
雷达图
多维度综合对比
词云图
文本数据的关键词频率可视化
气泡图
展示三维数据
2. 数据可视化表达的工具
电子表格工具(如Excel、WPS表格)
编程工具(如Python的Matplotlib、Seaborn库)
商业软件(如Tableau)
在线工具(如百度ECharts、阿里DataV等)
第六章 人工智能及其应用
一、认识人工智能
1. 人工智能的概念
人工智能(AI)是计算机科学的一个分支,是研究计算机模拟人的某些感知能力、思维过程和智能行为(如学习、推理、思考、规划等)的学科。
2. 图灵测试
图灵测试是判断机器是否具备智能的经典方法:在测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置向被测试者随意提问。经过多次测试后,如果被测试者超过70%的答复不能使测试者确认哪个是人、哪个是机器的回答,那么这台机器被认为具有人类智能。
3. 人工智能的诞生与发展
第一阶段(20世纪50年代—80年代) :符号主义快速发展,标志性成果包括第一台工业机器人诞生、首台聊天机器人问世等。1956年达特茅斯会议正式提出“人工智能”术语,标志着AI学科诞生。
第二阶段(20世纪80年代—90年代末) :低谷期,人工智能发展受阻。
第三阶段(21世纪初至今) :繁荣时期,深度学习等技术的突破推动AI蓬勃发展。
二、人工智能的应用
智能制造:智能装备(自动识别设备、人机交互系统、工业机器人)、智能工厂、智能服务
智能家居:智能冰箱、智能扫地机器人、指纹识别锁等
智能教育:智能导师通过自然语言处理和语音识别技术,对学生实施一对一教学
智能交通:ETC(不停车电子收费系统)、交通决策、路况预测
智能安防:利用AI对视频图像进行分析,识别安全隐患
智能医疗:辅助诊疗、疾病预测、医疗影像辅助诊断、药物开发。生物特征识别技术包括指纹识别、人脸识别、指静脉识别、声纹识别等
智能物流:搬运机器人、分拣机器人、货架穿梭机等
典型案例:深蓝(1997年战胜国际象棋冠军)、AlphaGo(2016年战胜世界围棋冠军)
核心知识串联与复习要点提示
1. 数据—信息—知识—智慧的递进关系
这是贯穿教材前两章的核心主线。数据是原料,经过加工成为信息,信息经过提炼成为知识,知识运用则产生智慧。
2. 计算机解决问题的一般过程
分析问题 → 设计算法 → 编写程序 → 调试运行程序。这是算法与程序设计章节的核心流程,也是培养学生的计算思维的关键。
3. Python编程的三种基本结构
顺序结构、选择结构、循环结构是程序设计的三大基石,需要结合具体实例理解和掌握它们的代码实现。
4. 大数据的4V特征与数据处理方法
大数据的“大量、多样、低价值密度、高速”四个特征决定了其数据处理方法与传统数据处理有本质区别——关注全体而非抽样,关注相关性而非因果,采用分布式存储和并行计算。
5. 人工智能的基本概念与主要应用领域
人工智能涉及符号主义、连接主义、行为主义三大流派,当前处于弱人工智能阶段。其应用已覆盖制造业、家居、教育、交通、安防、医疗、物流等多个领域,了解各领域AI技术的典型应用是本章考查的重点。
学科网(北京)股份有限公司
$