内容正文:
必修内容
第 ‹#› 页
第一章 数据与信息
数据与信息
感知数据
数据、信息与知识
数据与大数据
数据采集与编码
数据管理与安全
数据及其演变
数据与生活
数据与科学
数据
信息
知识
数据、信息与知识
数据采集
数字化
数制
编码
数据管理
数据安全
大数据的概念
大数据的特征
大数据思维
大数据对社会的影响
第 ‹#› 页
3
当今社会,数据体现出了前所未有的价值。每时句刻都有各种数据被人们发现、分析、利用,并创造出巨大的财富。数据改变着人们的生活、学习、工作方式,而数据的种类与形式也在不知不觉中变化着。
1.1.1 数据及其演变
早在远古时代,人们在长期的社会实践中就逐渐形成了数的概念。为了记数,居住在洞穴中的原始人就用石器或骨器在墙壁上刻画图案,这些图案就是最原始的“数据”。后来,人们发明了结绳记事的方式来记事或记数(如图1.1.1)。据《周易·系辞下》记载:“上古结绳而治,后世圣人易之以书契,百官以治,万民以察。”结绳记事的方法现已失传,但通过《易九家言》中“事大,大结其绳,事小,小结其绳,结之多少,随物众寨”的描述,大致可以了解到通过“大事大结,小事小结”来记录各种不同的事件和数量的情形。这些大小不一、数量不同的绳结也是“数据”。
随着文字与数字的出现,数据以更加明确的形式被记录下来。图1.1.2所示的是一块公元前3000多年的泥板,为当时生活在美索不达米亚地区的苏美尔人所遗留,泥板上以楔形文字记载的内容为“29086单位大麦37个月库辛”。这句话的意思明显与数据有关。
人类对于数据的利用在一定程度上依赖于载体,造纸术与印刷术的发明,使得数据的记录与传
输变得便捷高效,直至今日,这些技术还在发挥着重要作用。
1.1感知数据
什么是数据?
数据是一直改变的吗?
数据形式是单一的吗?
第 ‹#› 页
技术的发展为人们提供了更多记录数据的载体,除了文本形式的数据,图像与声音的 数据与信息记录方式也在发生变化。最早的图像由手绘而成,画家可以凭借高超的绘画技艺画出逼真的场景。摄影术的发明使得保存真实的图像变得更加便捷,某一时刻的真实情景可以快速地以照片的形式被记录下来。相对于图像,声音的保存则比较困难。直到19世纪,爱迪生发明了留声机,才得以将声音记录下来。
到了现代,数据的记录形式越来越多样化,数据量也不断地增长,手工处理数据的方式已经无法满足数据处理的需求,于是人们发明了各种各样的工具来协助处理。这些工具中最具代表性的是诞生于20世纪40年代的电子计算机,短短的几十年,计算机已成为数据处理的主要工具。互联网技术的发展,加速了数据的传输与处理;随着移动网络与传感器的普及,大数据进入了人们生活的方方面面。
在日常生活中,人们每天都在使用数据。比如在超市购物,结账后一般会收到购物单,上面列出了本次购买的商品与价格;购买的火车票上有时间、目的地、身份证号码等数据(如图1.1.3)。
比于这些传统数据,在互联网时代,人们生活中的数据形式也在发生改变。云计算、物联网、大数据等技术陆续融入生活。 数据的采集技术迅速发展,数据的表现形式也越来越多样化,给人们的生活习惯带来了巨大的转变。例如,以前人们每到一个新的城市,可能会购买一册当地最新版的地图,循着纸质地图上的路线来熟悉这个陌生的城市。现在则可以通过电子地图,预先了解目的地及周边的相关情况,通过电子地图的全景模式,可以全方位观察周围的环境,获得身临其境的体验,如图1.1.4所示。
1.1.2 数据与生活
想一想:数据在我们生活中起什么作用?
第 ‹#› 页
移动网络的升级大大扩展了手机的应用领域,手机的功能已不再局限于通话与短信,智能手机的各种应用给生活带来极大的便利。人们通过手机上的购物平台与电子支付系统,足不出户就可以购买到各种商品。同时,各种票据如机票、车票的形式也在转变,电子票据使得人们可以不必手持纸质票据就能乘坐交通工具。城市中的出租车服务体系也变得多样化,除了传统的巡游出租汽车,网约车(网络预约出租汽车)作为另一种营运模式,为乘客提供了更多的选择,人们通过手机上的各种网约车APP(如图1.1.5),可以方便地完成预约、支付等操作。
大多数数据会随着时间的推移而变化,为了更直观地了解数据的变化情况,不同的领域会以各自独特的形式予以展示。如股票交易中心的股票走势图,通过曲线、颜色等元素,使得股票的涨跌情况一目了然。
人们在利用数据的同时,自身的行为也在产生数据。图1.1.5 网约车APP如每年的春运都会有巨大的客运流量,根据这些乘客的出行情况制作出的迁徙图,可以形象地反映春运客流情况。互联网加速了数据的传递,通过与传统行业的深度融合,发展成了一种新的社会经济形态——“互联网+”,给传统行业注入了活力。如“互联网+农业”就是其中一个案例。
“互联网+”不仅仅改变了农业的生产与销售模式,也在影响着社会的各行各业。“互联网+”充分发挥互联网在社会资源配置中的优化和集成作用,提升了全社会的创新力和生产力。
1.1.2 数据与生活
实例 网约车、网上挂号、地图APP
数据来源
数据形式
数据作用
第 ‹#› 页
案例分析
杀熟/价格歧视/机票价格
随着大数据带来的就业需求,与之相关的职业需求急剧增长。(相对应的许多职业被智能所取代,关键是提升自身价值)
《滴滴》被国家网信办强制下架,设计国家安全(美国上市,存在一定危害),透露个人信息,若数据一旦被泄露。
个人信息:(司机信息:车牌、身份证,乘客信息,出行轨迹)组织:从使用人数来说,滴滴成为出行的基础设施之一。拥有大数据,根据排除法研究出行轨迹,找到相应地点甚至军事重地。
货车自燃事件,经大数据统计,召回的成本与发生灾害后的索赔成本。
第 ‹#› 页
7
自古以来,人们通过观察与实践,获得了大量数据,这些数据不仅在生产与生活中发挥了作用,而且为一些早期科学成果的取得打下了基础,如古人根据月相变化和季节更替的规律逐渐形成了我国特有的传统历法——农历,直至今日,在人们的生活中也经常用到农历。
科学研究离不开数据。科学强调证据,而数据的客观性正好为科学研究提供了可靠的依据。如天王星被发现后,天文学家发现它的运行轨道总是偏离根据万有引力定律计算出的路线,经过仔细计算,从而推算出了影响天王星的那颗未知星体——海王星。
现在各国都很重视高精尖实验室的建设,花费巨额经费来购买和研发实验设备,就是为了获取某些数据。例如,世界上最大的粒子物理学实验室——欧洲核子研究组织(通常简称为CERN),为高能物理学的研究提供宝贵的实验数据。CERN把大量的实验数据进行全球共享,让全世界的科学家和公众一起研究。迄今为止,CERN已经取得了多项巨大的科学成就。
思考与练习
1.在成长的道路上,我们已经留下了很多痕迹,这些痕迹大都可用数据来记录。哪些数据可以大致描述你的成长轨迹呢?
2.除了数字,在日常生活中还有哪些形式的数据?
1.1.3 数据与科学
第 ‹#› 页
数据来源的不同,决定了数据的多样性。从各个途径获取的大量的、庞杂的数据,需要经过一定的处理,才能从中提取有意义、有价值的内容。在人类发展的历史长河中,人们通过处理数据、分析数据,从中寻找规律,积累了丰富的知识,成为人类社会的宝贵财富。
1.2.1 数据
数据是对客观事物的符号表示,如图形符号、数字、字母等。其中,数字是最简单的一种数据,是对数据的一种传统和狭义的理解。
单纯的数据是没有意义的,因为数据的表现形式还不能完全表达其内容,经过解释,数据才变得有意义,数据和关于数据的解释是密不可分的。
随着人类社会进入数字化时代,计算机被广泛使用。数据的种类与表现形式也越来越多样化,数据在采集的方式、处理的速度等方面都有了质的飞跃,数据的含义也得到了扩展。
在计算机科学中,数据是指所有能输入到计算机并被计算机程序处理的符号总称,是用于输入到计算机中进行处理,具有一定意义的数字、字母、符号和模拟量等的通称。其表现形式可以是文字、图形、图像、音频、视频等。例如,人们在网上预订车票时,票的数量是数据,座位等级也是数据;观看在线影视时,点播的视频就是数据;而一个U盘、一张光盘,其存储的文件也统称为数据。
1.2数据、信息与知识 P8
第 ‹#› 页
信息自古就有,人类的生活一直与信息密切相关,人类通过了解信息来认识自然,利用信息进行发明创造。
1.信息的定义
到目前为止,信息还未有统一的定义,出于研究目的、观察角度的不同,不同的学科往往有自己的定义。信息论的莫基者克劳德·艾尔伍德·香农(Claude Elwood Shannon)在《通信的数学理论》中提出:“信息是用来消除随机不确定性的东西。”这一定义常被人们看作是经典性定义并加以引用。尽管不同的人对信息的定义可能有所不同,但所指向的都是同一对象,这些对象有些能被直接感受,有些需要借助设备或其他事物才能被感受。
比如向朋友介绍某款新车,对品牌、颜色、功率、内饰等属性描述得越多、越准确,朋友对该款新车的认识就越全面,即消除的随机不确定性越多。
1.2.2 信息
第 ‹#› 页
(1)载体依附性
信息是不能独立存在的,必须依附于一定的载体。如果存储信息的载体遭到破坏,那么其承载的信息就会消失。历史上,好多珍贵文献没有流传下来,究其原因,是这些文献的载体遭到破坏。如秦始皇的“焚书令”使得当时大量书籍被烧毁,这些书中的信息自然就丢失了。其中比较知名的是“四书五经”中的《尚书》,由此产生了今文与古文两个版本,引发了后世的真伪《尚书》之争。
同一信息也可以依附于不同的载体,因此人们获取信息的途径与方法也可以不同。例如,某场球赛的最终结果,人们可以通过电视直播获悉,也可以通过网络查询,还可以在与朋友交谈时得知。信息依附于载体也体现了信息的可存储性与传递性。
(2)时效性
信息往往反映的是事物某一特定时间内的状态,它会随着时间的推移而变化。及时掌握最新信息,人们才能更好地利用它。例如,强台风来临之前,要时刻关注台风的走向,在台风袭击之前做好人员撤离与设施加固等工作,尽量减少台风带来的影响。在台风过后,有关这次台风的信息对于本次防御的重要性就降低了。
2.信息的特征 P9
第 ‹#› 页
(3)共享性
信息是可以共享的,同一种信息可以同时被不同的接收者获取,人们也可以重复利用信息。与物质、能源不同的是,信息不会因为被别人获取而发生损耗。正如萧伯纳(GeorgeBemard Shaw)所说:“你有一个苹果,我有一个苹果,彼此交换一下,我们仍然各有一个苹果;但你有一种思想,我有一种思想,彼此交换,我们就都有了两种思想,甚至更多。”
(4)可加工处理性、真伪性
信息是可以加工处理的。信息经过加工、处理、分析后,可以更好地被人们所使用。这一特征使信息具有真伪性,如两军交战,双方总是想尽办法迷惑对方,让对方做出错误的决策,从而取得胜利。第二次世界大战期间,盟军利用种种虚假情报,诱使德军做出错误判断,造成了诺曼底地区的兵力空虚,使得盟军在诺曼底成功登陆。
(5)价值性
信息具有价值性,信息的价值包括显性价值与隐性价值。显性价值指的是信息内容本身具有的价值,一般可被人们直接了解或体会。如根据紫外线指数的预报,人们可以做好外出前的个人防护。而隐性价值指的是除信息内容外的价值,包括与信息紧密相关的所有价值,如人们利用所学知识和技能,通过收集、整理和总结获得的其他价值。
信息的价值也是相对的,对于不同的人群、不同的时间,其价值可能有所不同。例如,天气预报中有关海浪高度的信息,对于出海的渔民与居住在内陆的居民,其价值是不一样的。
2.信息的特征
思考:经过加工处理的信息具有更高价值?
第 ‹#› 页
知识,这个词语是每个人都耳熟能详的,“知识就是力量”等名言传诵至今。人们从小开始学习各种知识,从课堂上、书本上获取知识,也从生活中、社会上获取知识。
知识是人类在社会实践中所获得的认识和经验的总和,也是人类在实践中认识客观世界(包括人类自身)的成果,它包括对事实、信息的描述以及在教育和实践中获得的技能。
知识是可以继承和传递的。牛顿的名言“站在巨人肩膀上”可以理解为“站在前人的肩膀上”,前人的研究成果已经成为现在研究的基础,人类的知识就这样一代一代地传承下去。
1.2.3 知识
第 ‹#› 页
当人们孤立地看3.14时,它仅仅是一个数据;当人们在讨论圆的特性时,3.14是圆周率的近似值,这是信息;当人们用3.14乘以半径的平方来计算圆的面积时,这就是知识。
数据可以是数字、文字、图像、符号等,如上面的3.14,单独写在纸上,其本身没有明确的意义。将数据放在某个语境中,或在某个真实场景中使用,数据就有了意义,这就是信息。如3.14在上面的语境中是圆周率,如果在某个要填写日期的文本中写上3.14,那就不是圆周率,而是表示3月14日。
信息是数据经过储存、分析及解释后所产生的意义,通常是在某一特定情境脉络下的具体呈现。人们通过归纳、演绎、比较等手段对信息进行挖掘,将万千信息中有价值的部分沉淀下来,与已存在的人类知识体系相结合,形成知识。
与数据和信息相比,知识更接近行动,它与决策相关。当人们说某人掌握了某种知识时,不仅指的是他(她)“知道是什么”(Know-what),而且“知道为什么”(Know-why)以及“知道怎么做”(Know-how)。这就是为什么当人们在搜索引擎的帮助下可以获得海量信息,但这并不说明他们拥有海量的知识。而知识的丰富也不仅仅是依靠简单的检索、积累和存储。
1.2.4 数据、信息与知识的关系 P10
第 ‹#› 页
知识的获得,是人利用自身已有的知识对信息进行加工,进而将新的信息纳入自己的知识结构的过程。这不仅仅是对信息的积累,还是对信息进行分析、判断、确认、归纳、演绎或比较等一系列的认知过程。这个过程与知识建构者个人的经验储备、所处情境和反思能力有关,因此,即使面对同样的信息,不同的人会因理解不同,形成不同的知识。所谓“一百个人心中有一百个哈姆雷特”,即当人们接收同样的信息后,所建构的知识也是有区别的。
智慧是一种更高层次的综合能力,主要表现为收集、加工、应用、传播知识的能力,以及对事物发展的前瞻性看法。它是在知识的基础之上,通过认识的累积,而形成的对事物的认识、远见,体现为一种卓越的判断力。数据、所示。 信息、知识、智慧的关系如图1.2.1
1.2.4 数据、信息与知识的关系
数、数字、数据、信息
知识、智慧、智能(作业本补充-金字塔形)
第 ‹#› 页
DIKW体系(数据-信息-知识-智慧体系)
1.2.4 数据、信息与知识的关系
情景关联性
诸多整体的
联结
联结成为
整体
部分属性的
联结
事物的部分
属性
图1.2.1 数据、信息、知识、智慧的关系
数据
知识
信息
智慧
理解关系
情景模式
情景原理
过去的经验
未来的新奇
理解力
举例:1000 2000
啤酒和尿布的商品数量
形成正比关系
将两种商品放在一起,增加销售量
第 ‹#› 页
问题与讨论
诗人艾略特(T.S.Eliot)的诗句:Where is the wisdom we have lost in knowledge? Where is the knowledge we have lost in information?(智慧迷失在知识中,知识迷失在信息中)
你认为这两句诗表达了信息、知识和智慧之间怎样的关系?你能举出智慧迷失/没有迷失在知识中、知识迷失/没有迷失在信息中的四类例子吗?
根据下图说明数据(Data)、信息(Information)、知识(Knowledge)与智慧(Wisdom)的关系。
思考与练习
1.数据:相互独立,还没有意义
2.信息:经过注释、理解,有了意义
3.知识:数据之间建立关联,有了相互关系,能找出规律方案
4.智慧:快速定位到最优的一条,体现了洞察力、前瞻性
第 ‹#› 页
2.既然数据是对客观事物的符号表示,那么为什么我们会经常看到“虚假数据”这一词语?如何才能保证数据的真实性?
数据本身不会造假。但人可以更改数据
提高道德法律意识、采用机器采集数据,减少人工干预
思考与练习
第 ‹#› 页
人工获取(纸笔记录)→机器获取(网络爬虫等,机器获取数据成为主要的获取方式)
传感器:敏感元件(能感知测量物理、化学、生物量)和转换元件(转换为电信号),可连续随时不断从自然信源获取数据
如监测PM2.5的空气颗粒取样器、地感线圈记录车辆通行数据、GPS追踪设备、智能手机中传感器(声/光/环境/运动/ 通信/安全等)
P13
互联网:公众开放的数据服务,向用户提供应用程序接口——API,如获取气象、地图等原始数据
1.3.1 数据采集
1.3数据采集与编码
第 ‹#› 页
1.3.2 数字化 (数模转换A/D:模拟信号转为数字信号)
计算机只能处理数字化信息/只能处理二进制代码
100101100011101
模拟信号
数字信号
采样 量化 编码
图1.3.2 模拟信号的数字化过程
8.25 2班
第 ‹#› 页
世界上有10种人,一种是懂编码的,一种是不懂的。
第 ‹#› 页
1.3.3 数制(基本要素:基和权)
数制的基本概念
二进制就是逢二进一
十进制就是逢十进一
十六进制就是逢十六进一
1.3.1 进制的标识
进制数 二进制 八进制 十进制 十六进制
标识 B O D H
出现10的时候通常认为是十进制,为了防止歧义
10D为十进制
10B为二进制
10O为八进制
10H为十六进制
第 ‹#› 页
进位制 二进制 八进制 十进制 十六进制
规则 逢二进一 逢八进一 逢十进一 逢十六进一
基数 R=2 R=8 R=10 R=16
基本符号 0,1 0,1,2,…,7 0,1,2,…,9 0,1,..,9,A,..,F
权 2i 8i 10i 16i
形式表示 B O D H
1.3.3 数制(基本要素:基和权)
8.25 1班
第 ‹#› 页
二进制 十进制
2 25 ……1
2 12 ……0
2 6 ……0
2 3 ……1
2 1 …… 1
0
(2)二进制转化为十进制
1 1 0 0 1
按权展开求和
=16+8+1
=25
#课堂练习:将十进制数127、53分别转化为二进制数
25D=11001B
倒取余数
(1)将十进制25转化为二进制
第 ‹#› 页
十进制 十六进制(数码:0~9、A~F)
16 61 ……13( )
16 3 ……3
0
3 D(D对应13)
按权展开求和
=3×16+13×1
=61
#课堂练习:将十六进制数A372H转化为十进制数
#教材p16-17表1.3.2 各个进制数之间的关系
61D= 3DH
倒取余数
D
(1)将十进制61转为十六进制
(2)十六进制转化为十进制
第 ‹#› 页
十六进制 二进制
十六进制数转为二进制位数:每一位十六进制数转为4位二进制数,转换为二进制数后,可把最前端的0省略不写。
例如:3AH=________ B
3 A
0011 1010
111010
二进制数转化为十六进制数:从二进制的低位开始,每四位二进制数转换为一个十六进制数,位数不够,左边补0凑齐
例如 : 111010B= _______ H
11 1010
3 A(AH=10D)
111010
0011 1010
3A
课堂练习:7C
凑:1 2 4 8 法则
第 ‹#› 页
第 ‹#› 页
总结规律
进制数之间的相互转换
除以2,倒取余
除以16,倒取余
十进制数
二进制数
十六进制数
以2为底数,加权
以16为底数,加权
以4位为一组加权值转换
每1位十六进制转为4位二进制
第 ‹#› 页
思考1:十进制与X进制之间的相互转化方法?
思考2:进制数之间的加法运算?(十六进制)
思考3:两位十六进制如何进位?(39进一位)
第 ‹#› 页
1..n是一个后两位数字未知的6位二进制数1011 。下列数中与n+1不可能相等的是
A.2FH B.30H C.44D D.45D
【台州市2020年11月选考科目教学质量评估试题】
【答案】C
第 ‹#› 页
8.25作业:
《必修1 数据与计算(双色版)》P1-P8
1.1 第6题 在原文上标记,第8题不用做
1.2 第8 9题选做
交作业时间:每天一早交过来,晚自修之前拿回去
第 ‹#› 页
1.3.4 编码
ASCII码(美国信息交换标准代码)
基本的共有128个,用1个字节中的低7位编码。
二进制范围为00000000~01111111,即十六进制00~7F
转为十进制?
第 ‹#› 页
汉字编码
计算机中的汉字也是采用二进制进行编码的。
汉字编码分为外码、交换码、机内码和字形码。其中,外码也叫输入码,是用来将汉字输入到计算机中的一组键盘符号。常用的输入码有拼音码、五笔字形等。
根据国标码的规定,每一个汉字都有确定的二进制代码,在早期的GB2312字符集中,1个汉字在计算机中采用2个字节。
(补充:)计算机内部的汉字编码都采用机内码,一个汉字或者汉字标点占2个字节,英文字母或者英文标点占1个字节。
全角
半角
特殊字符的对应内码
空格 20
A 41
a 61
0 30
1 31
第 ‹#› 页
() -
1.使用UltraEdit软件查看字符“7B+C9等于?”的内码,部分界面如图所示。
下列说法正确的是
A.图中内码表示的ASCII码字符共有10个
B.字符“a”的十六进制内码是“41”
C.字符“于”的十六进制内码是“C8 D3 ”
D.字符“+”的内码用二进制表示是“00101011”
【2020年7月浙江省学业水平考试】
【答案】D
【解析】
A: ASCI码范围00~7F ,共有7个,A错
B:“B”内码为42,则“A”内码为41,小写和大写相差20,则“a内码“61”,B错
C:字符“于”的十六进制内码是"D3 DA”,C错
D:正确,“+”内码十六进制为“2B",转为二进制为“00101011”
第 ‹#› 页
二维码
(是用某种特定的几何图形按一定规律在平面上分布的黑白相间的图形记录数据符号信息)
【补充:】生成二维码的过程是编码,扫描二维码的过程是解码
复习:声音的采样、量化、编码
第 ‹#› 页
第 ‹#› 页
声音编码
当前修改的声道数
总时长:15s
量化位数:16bit
采样频率(HZ)
声道数
(立体声:2;单声道:1)
当前选中时间段
存储容量=采样频率(Hz)×量化位数(bit)×声道数×时长(s)(单位:位)
声音的保真度不仅受到采样频率的影响,也依赖于量化值。
比特率(bps)
第 ‹#› 页
37
声音编码
(补充:)比特率(1411kbps):每秒传输的数据量为1411千位;
采样频率(44100Hz);每秒钟采样的次数为44100次;
存储容量=比特率(bps)×时间(s)【音频、视频都适用】
拓展链接
数据的存储单位
计算机中存储容量的最小单位是比特(bit),一位二进制数码表示1bit,但由于1bit能表示的值太小,实际上计算机中以8bit为一个基本单位,称为字节(Byte)。常见的单位还有KB、MB等,他们之间的换算关系是:
1KB=1024B 1MB=1024KB 1GB=1024MB 1TB=1024GB
1PB=1024TB 1EB=1024PB 1ZB=1024EB
第 ‹#› 页
图像编码
数字图像包括矢量图形和位图图像
#矢量图形是指用点、直线或者多边形等基于数学方程的几何图元表示的图像。任意放大矢量图形不会丢失细节或者影响清晰度,矢量图形与分辨率无关。
#位图图像又称栅格图或者点阵图,将图像数字化也需要经过采样、量化、编码等环节。像素是组成位图图像的基本单位,放大后会失真。
存储容量=总像素×颜色位深度(单位:位)
#图像文件格式有:BMP、JPG 、GIF、PNG、JPG等
颜色位深度:256种颜色,位深度为8
RGB/8颜色位深度:24
黑白两色位深度:1
第 ‹#› 页
视频编码(静态图像连续播放就形成视频)
帧数:每秒播放的页数(动漫手稿)
存储容量=水平像素×垂直像素×颜色位深度×时间(s)×帧频(fps)
一帧图像的容量大小
总帧数
PAL制式 25fps、 NTSC制式30fps
视频压缩一般是指通过特定的压缩技术对视频进行压缩。常见的压缩方式有MPEG-1、MPEG-2、MPEG-4等
第 ‹#› 页
总结规律
第 ‹#› 页
1.一段未压缩的AVl格式无声视频,其参数如右图所示,且存储容量约为640MB,则表示该视频每个像素颜色的二进制位数为
视频
A.1 B.3 C.16 D.24
【2020学年第一学期浙南名校联盟第一次联考】
视频———————————
时长 00:00:12
帧宽度 1024
帧高度 768
数据速率 415855kbps
总比特率 415855kbps
帧速率 24.00帧/秒
【答案】D
【解析】AVI格式视频容量计算(B)=水平像素*垂直像素*每个像素所占的位数/8*时长*帧频,即1024*768*每个像素所占的位数*24*12/8/1024/1024=640 MB,每个像素所占的位数约为24b,可知D正确。
第 ‹#› 页
【答案】D
【解析】黑白两种颜色的量化位数为1,根据公式可得1024*768*1/8/1024/10=9.6,故压缩比约为10:1,选D项。
2.一张分辨率为1024*768,黑白2种颜色未经压缩的BMP图片,另存为JPEG格式后容量约为10KB,则其压缩比约为
A.25: l B.20: l C.15: l D.10: l
【2020年12月嘉兴市高三教学测试】
3.一段未经压缩的视频(不含声音),帧画面为1024*768像素,24位彩色,PAL制式,若视频文件有 675MB,则该视频时长大约为()
A.2秒 B . 3 秒 C.12秒 D.24秒
【答案】c
【解析】视频文件的大小公式为:水平像素×垂直像素×位深度×帧频×时间1024×768×24×25×t=675×1024×1024×8 t约为12
第 ‹#› 页
1.计算机一般采用树形目录结构来管理文件
1.4数据管理与安全
2.容灾系统:当一处系统因意外(如火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统可以继续正常工作(备份)
3.文件的MD5校验:将整个文件当作一个大文本信息,产生MD5下载校验码,比对前后的校验数据判断下载文件是否完整。(常见校验方法:MD5、CRC、SHA-1)
第 ‹#› 页
大数据特征(4V):
数量(volume)巨大,人类社会的量级单位已经从TB、PB级别跃升至EB、ZB级别。
速度(velocity)快,一是数据产生的速度快;二是数据处理的速度快。
类型(variety)多,各种结构化、半结构化和非结构化数据共存是大数据的普遍现象。
价值(value)密度低,因其数据量巨大,可能发挥价值的是其中非常小的一部分,存在许多冗余。
1.5数据与大数据
【注意:数据量大并不一定是大数据】
第 ‹#› 页
9.1 作业
《1.3数据采集与编码(二)》 第7(4)、8题不做
《1.4数据管理与安全》 第6题不做
《1.5数据与大数据》 第5题不做
第 ‹#› 页
第 ‹#› 页
$