4.2.3 文本数据处理课件-2025-2026学年浙教版高中信息技术必修一
2025-11-24
|
17页
|
370人阅读
|
169人下载
普通
资源信息
| 学段 | 高中 |
| 学科 | 信息技术 |
| 教材版本 | 高中信息技术浙教版必修1 数据与计算 |
| 年级 | 高一 |
| 章节 | 4.2 大数据处理 |
| 类型 | 课件 |
| 知识点 | - |
| 使用场景 | 同步教学-新授课 |
| 学年 | 2025-2026 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | PPTX |
| 文件大小 | 31.85 MB |
| 发布时间 | 2025-11-24 |
| 更新时间 | 2025-11-24 |
| 作者 | xkw-26253632 |
| 品牌系列 | - |
| 审核时间 | 2025-11-24 |
| 下载链接 | https://m.zxxk.com/soft/55088822.html |
| 价格 | 0.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
该高中信息技术课件围绕文本数据处理展开,系统讲解一般过程(数据采集、预处理、分析、结果输出与可视化)及应用(标签云、文本情感分析),结合古诗词词云等项目实践,构建从理论到实践的学习支架。
其亮点在于理论与实例结合,通过标签云制作(如《全唐诗》含“春风”“秋”等词云)和情感分析(网络舆情“乐”“悲”折线图),培养信息意识(数据可视化与价值判断)和计算思维(问题分解与算法应用)。采用项目式教学,学生提升数字化实践能力,教师可高效开展教学。
内容正文:
文本数据处理
浙教版信息科技
1 文本数据处理的一般过程
中文分词
特征提取
2 文本数据分析与应用
标签云
文本情感分析
请注意:
1.正文标题为:黑体,30号字;
2.正文内容为:华文楷体,尽量不小于24号,特殊辅助性文字不低于18;根据文字量可适当调整。内容文字一行一般不能超过28个字,单页文字一般不能超过8行。
3.拍摄版本呈现内容务必与上传版本呈现的内容完全一致。
英文
1.正文标题为:以Times New Roman为主,可搭配使用Arial。字号为32—36号,特别强调可以用40号。
2.正文内容为:以Times New Roman为主,可搭配使用Arial。字号为24—28号,特别强调可用32号。
3.英文每行一般不能超过15个单词;单页文字一般不能超过8行。
2
视频
3
标签云是文本可视化的一种方式。用词频代表文本特征,以文字大小代表词语的重要性。将文本中复杂的或者难以通过文字表达的内容和规律以视觉符号的形式表达出来,使人们能利用视觉感知能力快速获取文本数据中蕴含的关键信息。
标签云概念
4
数据分析
结果呈现
一、文本数据处理的一般过程
文本数据
文本数据
中文分词
中文分词
特征提取
特征提取
数据分析
数据分析
5
一、文本数据处理的一般过程
文本数据
文本数据
中文分词
特征提取
数据分析
结果呈现
6
一、文本数据处理的一般过程
文本数据
文本数据
中文分词
特征提取
数据分析
结果呈现
文化
自信
是
基础
,
道路
自信
、
理论
自信
、
制度
自信
,
是
文化
自信
的
具体
表现
。
词语
文化
自信
是
基础
道路
理论
制度
的
具体
表现
、
,
。
中文分词
7
文本数据
文本数据
中文分词
特征提取
数据分析
结果呈现
中文分词
1.基于词典
2.基于统计
3.基于规则
1.基于词典的分词方法
分析句子时与词典中词语进行对比,词典中存在则划分为词。
2.基于统计的分词方法
依据上下文相邻字出现的频率统计,频率越高则越可能是词。
3.基于规则的分词方法
让计算机模拟人的理解方式,学习大量资料后,达到分词效果。
一、文本数据处理的一般过程
8
文本数据
文本数据
中文分词
特征提取
数据分析
结果呈现
中文分词
特征提取
词语 词频
文化 2
自信 5
是 2
基础 1
道路 1
理论 1
制度 1
的 1
具体 1
表现 1
、 2
, 2
。 1
文化自信是基础,道路自信、理论自信、制度自信,是文化自信的具体表现。
词语 词频
自信 5
文化 2
基础 1
道路 1
理论 1
制度 1
具体 1
表现 1
特征提取
将词作为特征项,通过特征提取获得最有代表性特征词,提高文本处理效率。
一、文本数据处理的一般过程
9
文本数据
文本数据
中文分词
特征提取
数据分析
结果呈现
中文分词
特征提取
数据分析
结果呈现
一、文本数据处理的一般过程
10
唐诗宋词是中国文学史上的两颗明珠,我们从小到大背诵过很多诗词,但始终无法穷尽近5万首唐诗与2万多篇宋词。请制作古诗词标签云,探秘隐藏其中鲜为人知的信息。
项目实践:探秘古诗词
11
《全唐诗》
《全宋词》
项目实践:探秘古诗词
12
文本情感分析:
通过计算机技术对文本的主观性、观点、极性进行挖掘和分析。主要应用于网络舆情监控、用户评论分析等领域。
二、文本数据分析与应用
13
——文本情感分析
二、文本数据分析与应用
14
图1.网络游记时间特征的情感分析
二、文本数据分析与应用
15
图2.不同地区某手机品牌用户评论积极情感可视化
二、文本数据分析与应用
16
1.文本处理的一般过程
文本数据
文本数据
中文分词
特征提取
数据分析
结果呈现
中文分词
特征提取
数据分析
结果呈现
2.文本数据分析与应用
标签云的制作
文本情感分析
课堂小结
17
Lavf57.25.100
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。