2.4 算法与程序综合应用之Python语言中jieba库的应用 2021—2022学年人教中图版必修一

2021-12-27
| 6页
| 1321人阅读
| 411人下载
普通

资源信息

学段 高中
学科 信息技术
教材版本 高中信息技术人教/中图版必修1 数据与计算
年级 高一
章节 2.4.3 算法与程序实现的综合应用
类型 教案
知识点 -
使用场景 同步教学
学年 2021-2022
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 DOC
文件大小 605 KB
发布时间 2021-12-27
更新时间 2021-12-27
作者 xkw_057035942
品牌系列 -
审核时间 2021-12-27
下载链接 https://m.zxxk.com/soft/31962226.html
价格 0.00储值(1储值=1元)
来源 学科网

内容正文:

2021—2022学年人教中图版必修一 2.4 算法与程序综合应用之Python语言中jieba库的应用 一、jieba库基本介绍   (1)、jieba库概述          jieba是优秀的中文分词第三方库          - 中文文本需要通过分词获得单个的词语          - jieba是优秀的中文分词第三方库,需要额外安装          - jieba库提供三种分词模式,最简单只需掌握一个函数   (2)、jieba分词的原理          Jieba分词依靠中文词库          - 利用一个中文词库,确定汉字之间的关联概率          - 汉字间概率大的组成词组,形成分词结果          - 除了分词,用户还可以添加自定义的词组 二、jieba库使用说明   (1)、jieba分词的三种模式          精确模式、全模式、搜索引擎模式          - 精确模式:把文本精确的切分开,不存在冗余单词          - 全模式:把文本中所有可能的词语都扫描出来,有冗余          - 搜索引擎模式:在精确模式基础上,对长词再次切分   (2)、jieba库常用函数   三、jieba应用实例     四、利用jieba库统计三国演义中任务的出场次数 import jieba txt = open("D:\\三国演义.txt", "r", encoding='utf-8').read() words = jieba.lcut(txt) # 使用精确模式对文本进行分词 counts = {} # 通过键值对的形式存储词语及其出现的次数 for word in words: if len(word) == 1: # 单个词语不计算在内 continue else: counts[word] = counts.get(word, 0) + 1 # 遍历所有词语,每出现一次其对应的值加 1 items = list(counts.items())#将键值对转换成列表 items.sort(key=lambda x: x[1], reverse=True) # 根据词语出现的次数进行从大到小排序 for i i

资源预览图

2.4 算法与程序综合应用之Python语言中jieba库的应用 2021—2022学年人教中图版必修一
1
2.4 算法与程序综合应用之Python语言中jieba库的应用 2021—2022学年人教中图版必修一
2
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。