内容正文:
1.5 数据与大数据 1课时(分层作业)
【基础达标】
1.以下关于大数据推送的描述,正确的是( )
A.大数据推送仅涉及收集大量数据,但不进行任何分析或应用,所以没有安全隐患
B.大数据推送是将所有可用数据随机发送给不同用户,用户按自己的喜好进行选择
C.大数据推送是指通过人工筛选并发送个性化信息给用户的过程
D.大数据推送是利用大型数据集分析用户行为,从而自动发送定制化的内容或服务到用户的设备
答案:D
解析:本题考查的是大数据应用。大数据推送是利用数据分析用户行为,自动发送定制化内容,D正确。
2.某地图软件为前往贵阳野生动物园的游客提供智能服务:除展示园区位置、动物展馆分布等静态信息外,还整合游客评分、实时客流量、地理定位数据等,并通过算法实时规划避堵路线。下列关于该场景中大数据应用的说法,不正确的是( )
A.地图软件获取的每个数据必须绝对准确无误
B.实时路况数据生成与系统处理响应均具高速特性
C.因全天候采集海量位置数据,其价值密度相对较低
D.导航系统实时规划最优行驶路线是大数据的典型应用
答案:A
解析:本题考查的是大数据应用。大数据应用中,数据往往来自多种来源(如用户GPS、传感器等),可能存在误差、噪声或不完整性。系统通过算法(如数据清洗、冗余处理)来整体提升可靠性,而非要求每个数据点都绝对准确。故选A。
3.人们经常利用计算机程序解决问题,例如使用微信小程序购物、点单、查看健康码、办公、办事等。“粤省事”小程序的健康码可用于辅助防疫,靠的是大数据技术的支撑。从互联网产生大数据角度来看,下面哪个不是大数据的特征( )
A.大量 B.高速 C.多样 D.价值密度高
答案:D
解析:本题考查的是大数据特征。大数据通常被定义为具有“4V”特征:大量(Volume):数据规模巨大,远超传统数据处理能力。高速(Velocity):数据生成、传输和处理速度极快。多样(Variety):数据来源和类型多样,包括结构化、半结构化和非结构化数据。价值(Value):但大数据的关键是价值密度低(Value Density Low),即数据总量虽大,真正有价值的信息比例较低,需要通过技术手段提取。故选D。
4.某新式摄像头内置AI功能,基于海量数据训练,可以通过视觉识别技术初步判断车辆的危险行为和违规行为,比如打电话或者未系安全带,再将数据上传到服务器由交警进行审核,为构建城市交通大数据模型提供大量有参考意义的数据。下列关于该系统中的数据,说法不正确的是( )
A.可以通过增加训练数据提高该系统识别的准确性
B.城市交通大数据的特点是处理速度快,数据体量大
C.使用城市交通大数据进行实时导航主要利用流计算处理
D.交通摄像头采集到的数据主要为结构化数据
答案:D
解析:本题考查的是数据。摄像头直接采集的图像/视频是非结构化数据,结构化数据通常是处理后生成的表格或标签形式。故选D。
5.随着大数据与人工智能技术的应用,台风预警的精准度和时效性显著提升。通过整合卫星、雷达等多源数据,构建台风大模型,并利用机器深度学习算法分析台风规律,实现路径、强度及影响的精准预测。人工智能技术还能实时动态模拟台风演变,优化预警模型,为防灾减灾提供更科学的决策支持。以下关于大数据在台风预警中应用的说法,正确的是( )
A.只需要抽取沿海地区的气象数据即可进行台风预警
B.只有采集的每个数据都准确无误才能进行台风预警
C.大数据技术进行台风预警强调对因果关系的探求
D.大数据提高了数据分析的即时性,让台风预警更精确
答案:D
解析:本题考查的是大数据的应用。A选项错误:台风预警需要整合多源数据(如卫星、雷达等),而不仅仅是沿海地区的气象数据。 B选项错误:大数据技术可以处理不完美或噪声数据,并不要求每个数据都绝对准确。 C选项错误:大数据技术更注重相关性分析而非因果关系的探求。 D选项正确:题干明确提到大数据和人工智能技术提升了预警的精准度和时效性,符合描述。故选D。
6.人工智能DeepSeek在推理、自然语言理解与生成、图像与视频分析、语音识别与合成、个性化推荐、大数据处理与分析、跨模态学习以及实时交互与响应等八大领域表现出色。其研发团队通过“数据蒸馏”和“混合专家”等技术实现了显著的成本优势。下列选项中关于数据管理与安全和大数据的说法不正确的是( )
A.DeepSeek管理数据采用的是传统数据库管理
B.DeepSeek会收集与人类的交互信息用于自我学习,可以通过数据加密保护数据的安全
C.训练DeepSeek使用的大数据蕴含着巨大的价值,价值密度相对较低
D.DeepSeek在进行大数据处理与分析时,分析的是全体数据
答案:A
解析:本题考查大数据。 A 选项错误,DeepSeek 涉及多领域复杂数据处理,还采用 “数据蒸馏” 等技术,传统数据库管理难以满足其需求,不会仅采用传统数据库管理。 B 选项正确,DeepSeek 收集交互信息自我学习,数据加密是保护数据安全的有效方式,可用于保护这些数据。 C 选项正确,大数据虽蕴含巨大价值,但往往价值密度低,需经过处理分析才能提取有价值信息,训练 DeepSeek 的大数据也符合这一特点。 D 选项正确,大数据处理与分析通常针对全体数据进行,而非抽样数据,DeepSeek 在进行大数据处理与分析时分析全体数据是合理的。 因此,本题选择 A 选项。
【能力提升】
1.地图系统APP能够帮助用户快速精准地查询各类地理位置信息,提供实时导航与多模式路线规划服务,还整合了丰富的周边生活服务资源,助力用户高效规划出行路线,满足不同场景下的出行与生活需求。根据材料,下列关于大数据的说法,正确的是( )
A.该系统中处理的数据均属于流数据
B.大数据的应用不止为生活提供了便利,也增加了个人隐私泄露的风险
C.采集到的数据都是用批处理计算进行处理
D.地图中获取到的数据属于大数据,所以是准确无误的
答案:B
解析:本题考查大数据。
A选项错误:地图系统中的数据不全是流数据(实时连续产生的数据,如GPS轨迹、实时路况),还包括静态数据(如POI信息、历史地图数据)。B选项正确:大数据确实提升了生活便利性(如实时导航、周边推荐)。但用户位置、行为等数据的采集与存储可能引发隐私泄露风险(如数据滥用、黑客攻击)。C选项错误:数据处理的模式包括批处理(如离线更新地图数据)和流处理(如实时交通分析),并非全部用批处理。D选项错误:大数据≠100%准确。地图数据可能因采集误差、更新延迟(如新修道路未录入)或用户输入错误导致不准确。故正确答案为:选项B。
2.大数据、人工智能的迅猛发展和普及,为杭州亚运场馆加入了许多数智化创新元素。例如电竞中心运用全感知的5G数字基座,接入了设备数量超万台、数据类型达10万种以上的“数字驾驶舱”,可以实现场馆的智能化管理,也可借助人行、车行设备系统实现对车辆数据、通行数据、检票数据的流量分析及预警。下列关于大数据,说法正确的是( )
A.5G数字基座内的数据产生速度极快,但处理速度较慢
B.对通行、检票数据等进行流量分析及预警时,每个数据都要确保精确无误
C.电竞中心采集的大数据数据量庞大,价值密度相对较低
D.大数据技术的应用不会带来任何社会问题
答案:C
解析:本题考查大数据的基本特征及相关概念。 A 选项错误,大数据的特征之一是 Velocity(高速),即数据产生速度快,且需要快速处理以满足实时分析需求,并非处理速度较慢。 B 选项错误,大数据分析注重总体趋势和概率统计,不要求每个数据都精确无误,允许一定程度的混杂性。 C 选项正确,大数据具有 Volume(大量)和 Value(低价值密度)的特征,电竞中心采集的海量数据中,有价值的信息往往需要通过处理才能提取,符合价值密度相对较低的特点。 D 选项错误,大数据技术的应用可能带来隐私泄露、数据安全、算法偏见等社会问题。 因此,本题选择 C 选项。
3.城市交通管理部门可以利用历史数据和实时监测数据,生成未来一周多个重点区域的拥堵预测图。下图所示为过去一周与未来一周的拥堵延时指数情况,以下说法错误的是( )
A.图中未来一周拥堵预测是通过折线图展示随时间序列的变化趋势
B.智慧交通利用大数据技术进行实时交通流量预测,以缓解交通拥堵
C.智慧交通中大数据技术仅需少量抽样数据即可精准预测交通趋势
D.实时处理交通摄像头视频流数据体现了大数据技术的“处理速度快(Velocity)”特征
答案:C
解析:本题考查大数据。大数据预测需要大量数据,C错误。因此,本题选择C。
4.关于智能交通,以下说法不正确的是( )
A.当用手机导航时,用户既是交通数据的使用者,同时也是交通数据的贡献者
B.大数据的特征是数据量大、速度快、数据类型多、价值密度高
C.大数据的处理对象是全体数据,而不是抽样数据
D.智能交通整合了大数据、云计算等多项技术
答案:B
解析:本题考查的是大数据特征。大数据由于数据量巨大,有用信息相对稀疏,因此价值密度低,而非“价值密度高”。故选B。
【链接真题】
(2025高二下·浙江杭州·学业考试)1.智慧旅游系统是以物联网、云计算、大数据、人工智能等新一代信息技术为支撑,以游客为中心,以实现一体化的旅游公共服务为目标的大型信息系统。该系统通过云平台实时分析景点及周边游客数据,功能包括酒店预订、门票预订、客流检测、旅游线路规划、餐饮推荐等诸多功能。系统采用B/S、C/S混合模式构建,用户通过浏览器或手机APP都能访问。下列关于该系统中大数据的说法,不正确的是( )
A.通过云平台实时分析景点及周边游客数据,可以使用流计算
B.酒店预订和门票预订的数据是非结构化数据
C.使用大数据技术实现的餐饮推荐功能不需要知道游客的饮食爱好
D.大数据技术给生活带来了便利的同时也产生了安全隐患
答案:B
解析:本题考查的是大数据。选项A正确:流计算(Stream Computing)适用于实时数据处理场景,符合题干中“实时分析景点及周边游客数据”的需求。选项B错误:酒店预订和门票预订数据(如订单号、时间、价格等)通常是结构化数据(如数据库表),而不是非结构化数据(如文本、图片)。选项C正确:餐饮推荐可通过协同过滤等大数据技术实现(如基于群体行为模式),不需要知道游客的饮食爱好。选项D正确:大数据技术存在隐私泄露、数据滥用等安全隐患,是公认的双刃剑。故选B。
(2023年浙江期中模拟考)2.“无人驾驶”情境问题,根据给定材料,完成题目。
2025年5月4日,无人驾驶小巴(如图所示)在花溪大学城投入运营。小巴的车身遍布激光雷达、超声波雷达、摄像头等传感器,实时感知复杂道路信息,并将数据交由“大脑”——人工智能算法处理。小巴的交互式显示屏可实时显示车速及周边环境数据,乘客还可通过显示屏调节氛围灯色调、空调温度,并查看站点信息。
(1)小巴自动控制系统经车载传感器实时采集周围环境数据,并在毫秒级时间内完成数据处理,进而做出行驶决策。该过程主要体现了大数据的哪项特征( )
A.数据处理速度快 B.数据来源多
C.数据价值密度相对较低 D.收集和分析的数据量非常大
(2)小巴每次能实现精准停车,准确停在站点的相应停车位上,使用到的技术不包括( )
A.卫星导航 B.激光雷达 C.机器翻译 D.视觉识别
(3)下列关于小巴自动控制系统中硬件和网络的说法,正确的是( )
A.车载终端配备有处理器组件
B.该系统无需在小巴上配备输出设备
C.车辆行驶数据传输至服务器无需遵循网络协议
D.车载硬盘属于输入设备,用于存储行驶数据记录
答案:(1)A;(2)C;(3)A
解析:本题考查的是大数据与信息系统。
(1)“在毫秒级时间内完成数据处理” 体现数据处理速度快,A 符合;B 说的是数据来源,材料未体现来源多;C 说价值密度低,材料没体现;D 说数据量非常大,材料重点在处理速度,不是数据量,所以选 A。
(2)卫星导航可定位,激光雷达、视觉识别可感知环境辅助停车,机器翻译是语言转换,和精准停车无关,所以选 C。
(3)A,车载终端要处理数据,需处理器组件,正确;B,有交互式显示屏等输出设备,“无需” 错误;C,网络传输需遵循网络协议,“无需” 错误,所以选 A。
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$
1.5 数据与大数据 1课时(分层作业)
【基础达标】
1.以下关于大数据推送的描述,正确的是( )
A.大数据推送仅涉及收集大量数据,但不进行任何分析或应用,所以没有安全隐患
B.大数据推送是将所有可用数据随机发送给不同用户,用户按自己的喜好进行选择
C.大数据推送是指通过人工筛选并发送个性化信息给用户的过程
D.大数据推送是利用大型数据集分析用户行为,从而自动发送定制化的内容或服务到用户的设备
2.某地图软件为前往贵阳野生动物园的游客提供智能服务:除展示园区位置、动物展馆分布等静态信息外,还整合游客评分、实时客流量、地理定位数据等,并通过算法实时规划避堵路线。下列关于该场景中大数据应用的说法,不正确的是( )
A.地图软件获取的每个数据必须绝对准确无误
B.实时路况数据生成与系统处理响应均具高速特性
C.因全天候采集海量位置数据,其价值密度相对较低
D.导航系统实时规划最优行驶路线是大数据的典型应用
3.人们经常利用计算机程序解决问题,例如使用微信小程序购物、点单、查看健康码、办公、办事等。“粤省事”小程序的健康码可用于辅助防疫,靠的是大数据技术的支撑。从互联网产生大数据角度来看,下面哪个不是大数据的特征( )
A.大量 B.高速 C.多样 D.价值密度高
4.某新式摄像头内置AI功能,基于海量数据训练,可以通过视觉识别技术初步判断车辆的危险行为和违规行为,比如打电话或者未系安全带,再将数据上传到服务器由交警进行审核,为构建城市交通大数据模型提供大量有参考意义的数据。下列关于该系统中的数据,说法不正确的是( )
A.可以通过增加训练数据提高该系统识别的准确性
B.城市交通大数据的特点是处理速度快,数据体量大
C.使用城市交通大数据进行实时导航主要利用流计算处理
D.交通摄像头采集到的数据主要为结构化数据
5.随着大数据与人工智能技术的应用,台风预警的精准度和时效性显著提升。通过整合卫星、雷达等多源数据,构建台风大模型,并利用机器深度学习算法分析台风规律,实现路径、强度及影响的精准预测。人工智能技术还能实时动态模拟台风演变,优化预警模型,为防灾减灾提供更科学的决策支持。以下关于大数据在台风预警中应用的说法,正确的是( )
A.只需要抽取沿海地区的气象数据即可进行台风预警
B.只有采集的每个数据都准确无误才能进行台风预警
C.大数据技术进行台风预警强调对因果关系的探求
D.大数据提高了数据分析的即时性,让台风预警更精确
6.人工智能DeepSeek在推理、自然语言理解与生成、图像与视频分析、语音识别与合成、个性化推荐、大数据处理与分析、跨模态学习以及实时交互与响应等八大领域表现出色。其研发团队通过“数据蒸馏”和“混合专家”等技术实现了显著的成本优势。下列选项中关于数据管理与安全和大数据的说法不正确的是( )
A.DeepSeek管理数据采用的是传统数据库管理
B.DeepSeek会收集与人类的交互信息用于自我学习,可以通过数据加密保护数据的安全
C.训练DeepSeek使用的大数据蕴含着巨大的价值,价值密度相对较低
D.DeepSeek在进行大数据处理与分析时,分析的是全体数据
【能力提升】
1.地图系统APP能够帮助用户快速精准地查询各类地理位置信息,提供实时导航与多模式路线规划服务,还整合了丰富的周边生活服务资源,助力用户高效规划出行路线,满足不同场景下的出行与生活需求。根据材料,下列关于大数据的说法,正确的是( )
A.该系统中处理的数据均属于流数据
B.大数据的应用不止为生活提供了便利,也增加了个人隐私泄露的风险
C.采集到的数据都是用批处理计算进行处理
D.地图中获取到的数据属于大数据,所以是准确无误的
2.大数据、人工智能的迅猛发展和普及,为杭州亚运场馆加入了许多数智化创新元素。例如电竞中心运用全感知的5G数字基座,接入了设备数量超万台、数据类型达10万种以上的“数字驾驶舱”,可以实现场馆的智能化管理,也可借助人行、车行设备系统实现对车辆数据、通行数据、检票数据的流量分析及预警。下列关于大数据,说法正确的是( )
A.5G数字基座内的数据产生速度极快,但处理速度较慢
B.对通行、检票数据等进行流量分析及预警时,每个数据都要确保精确无误
C.电竞中心采集的大数据数据量庞大,价值密度相对较低
D.大数据技术的应用不会带来任何社会问题
3.城市交通管理部门可以利用历史数据和实时监测数据,生成未来一周多个重点区域的拥堵预测图。下图所示为过去一周与未来一周的拥堵延时指数情况,以下说法错误的是( )
A.图中未来一周拥堵预测是通过折线图展示随时间序列的变化趋势
B.智慧交通利用大数据技术进行实时交通流量预测,以缓解交通拥堵
C.智慧交通中大数据技术仅需少量抽样数据即可精准预测交通趋势
D.实时处理交通摄像头视频流数据体现了大数据技术的“处理速度快(Velocity)”特征
4.关于智能交通,以下说法不正确的是( )
A.当用手机导航时,用户既是交通数据的使用者,同时也是交通数据的贡献者
B.大数据的特征是数据量大、速度快、数据类型多、价值密度高
C.大数据的处理对象是全体数据,而不是抽样数据
D.智能交通整合了大数据、云计算等多项技术
【链接真题】
(2025高二下·浙江杭州·学业考试)1.智慧旅游系统是以物联网、云计算、大数据、人工智能等新一代信息技术为支撑,以游客为中心,以实现一体化的旅游公共服务为目标的大型信息系统。该系统通过云平台实时分析景点及周边游客数据,功能包括酒店预订、门票预订、客流检测、旅游线路规划、餐饮推荐等诸多功能。系统采用B/S、C/S混合模式构建,用户通过浏览器或手机APP都能访问。下列关于该系统中大数据的说法,不正确的是( )
A.通过云平台实时分析景点及周边游客数据,可以使用流计算
B.酒店预订和门票预订的数据是非结构化数据
C.使用大数据技术实现的餐饮推荐功能不需要知道游客的饮食爱好
D.大数据技术给生活带来了便利的同时也产生了安全隐患
(2023年浙江期中模拟考)2.“无人驾驶”情境问题,根据给定材料,完成题目。
2025年5月4日,无人驾驶小巴(如图所示)在花溪大学城投入运营。小巴的车身遍布激光雷达、超声波雷达、摄像头等传感器,实时感知复杂道路信息,并将数据交由“大脑”——人工智能算法处理。小巴的交互式显示屏可实时显示车速及周边环境数据,乘客还可通过显示屏调节氛围灯色调、空调温度,并查看站点信息。
(1)小巴自动控制系统经车载传感器实时采集周围环境数据,并在毫秒级时间内完成数据处理,进而做出行驶决策。该过程主要体现了大数据的哪项特征( )
A.数据处理速度快 B.数据来源多
C.数据价值密度相对较低 D.收集和分析的数据量非常大
(2)小巴每次能实现精准停车,准确停在站点的相应停车位上,使用到的技术不包括( )
A.卫星导航 B.激光雷达 C.机器翻译 D.视觉识别
(3)下列关于小巴自动控制系统中硬件和网络的说法,正确的是( )
A.车载终端配备有处理器组件
B.该系统无需在小巴上配备输出设备
C.车辆行驶数据传输至服务器无需遵循网络协议
D.车载硬盘属于输入设备,用于存储行驶数据记录
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$