内容正文:
必修1 数据与计算
专题一 数据、信息及人工智能
思维导图
一、数据、信息与知识
1.数据是对客观事物的符号表示,如图形符号、数字、字母等。在计算机
科学中,数据是指所有能输入到计算机并被计算机程序处理的符号总称,
是用于输入到计算机中进行处理,具有一定意义的数字、字母、符号和
模拟量等的通称。
2.数据的表现形式可以是文字、图形、图像、音频、视频等。
3.信息是指数据、信号、消息中所包含的意义。信息论的奠基者克劳德·艾尔伍德·香农(Claude Elwood Shannon)在《通信的数学理论》中提出:
“信息是用来消除随机不确定性的东西。”
4.物质、能源、信息是人类赖以生存的基础。
归纳提炼
5.信息的特征:
(1)载体依附性。(2)时效性。(3)共享性。(4)可加工处理性、真伪性。(5)价值性。
6.知识是人类在社会实践中所获得的认识和经验的总和,也是人类在实践中认识客观世界(包括人类自身)的成果,它包括对事实、信息的描述以及在教育和实践中获得的技能。知识是可以继承和传递的。
7.数据、信息、知识和智慧的关系
(1)数据可以是数字、文字、图像、符号等,数据本身没有明确的意义。
(2)信息是数据经过储存、分析及解释后所产生的意义。
(3)通过归纳、演绎、比较等手段对信息进行挖掘,将信息中有价值的部分沉淀下来,与已存在的人类知识体系相结合,形成知识。
(4)智慧是一种更高层次的综合能力,主要表现为收集、加工、应用、传播知识的能力,以及对事物发展的前瞻性看法。它是在知识的基础之上,通过认识的累积,而形成的对事物的认识、远见,体现为一种卓越的判断力。
二、数据管理与安全
1.数据管理是利用计算机硬件和软件技术对数据进行有效收集、存储、
处理和应用的过程,其目的在于充分、有效地发挥数据的作用。
2.计算机数据的管理经历了三个阶段:人工管理、文件管理和数据库管理。
3.数据可以分为:结构化数据、半结构化数据和非结构化数据。
4.威胁数据安全的因素:硬盘驱动器损坏、操作失误、黑客入侵、感染计算机病毒、遭受自然灾害等。
5.保证数据安全的方法:
(1)介质保护:通过磁盘阵列、数据备份、异地容灾等手段。
(2)数据本身安全:通过数据加密、数据校验等方法提高数据的保密性和
完整性。
三、数据与大数据
1.大数据代表着信息量大、速度快、种类繁多的信息资产,需要特定的技术和分析方法将其转化为价值。
2.大数据的特征
数据规模大、处理速度快、数据类型多、价值密度低四个特征,可以用4个V概括:数量(Volume)、速度(Velocity)、多样(Variety)和价值(Value)。
具体为:
(1)数据体量巨大:已经从TB、PB级别跃升至EB、ZB级别。
(2)速度快:数据产生的速度快、数据处理的速度快。
(3)数据类型多:既有人工产生的,也有机器自动产生的。
(4)价值密度低:价值密度相对较低,价值密度的高低与数据总量的大小成
反比。
3.大数据思维
(1)大数据要分析的是全体数据,而不是抽样数据。
(2)对于数据不再追求精确性,而是能够接受数据的混杂性。
(3)不一定强调对事物因果关系的探求,而是更加注重它们的相关性。
4.大数据对社会的影响
大数据让生活更便利,大数据让决策更精准,大数据带来新的就业需求,大数据也带来信息泄露、数据安全、个人隐私甚至伦理道德等方面的社会问题。
四、人工智能及应用
1.人工智能的概念
人工智能(Artificial Intelligence),简称AI。是指以机器(计算机)为载体,模仿、延伸和扩展人类智能,其与人类或其他动物所呈现的生物智能有着
重要区别。
2.人工智能的主要方法
(1)符号主义(Symbolicism),又称逻辑主义、心理学派或计算机学派,认为学习或者其他的智能特征原则上均可以被符号精确地描述,从而被机器仿真。在符号主义人工智能中,智能行为就是对符号的推理和运算。
(2)联结主义(Connectionism),又称仿生学派或生理学派,通过模仿人类大脑中神经元之间的复杂交互来进行认知推理。其主要原理为神经网络及神经网络间的连接机制与学习算法。典型代表深度学习。
(3)行为主义(Actionism),又称进化主义或控制论学派,其原理为控制论及感知-动作型控制系统。这一方法从“交互—反馈”角度来刻画智能行为,认为智能体可以在与环境的交互中不断学习,从而提升自己的智能水平。
3.人工智能的发展历程
(1)从计算到智能测试。图灵机成为现代计算机的理论模型。1950年提出了“图灵测试”。
(2)人工智能登上历史舞台。1956年,“人工智能达特茅斯夏季研讨会”
标志着人工智能正式诞生。
(3)以符号主义表达与推理为代表的人工智能。“手工构造知识库+推理
引擎”的“专家系统”,如IBM研制的“沃森(Wat