2.4 算法与程序综合应用之Python语言中jieba库的应用 2021—2022学年人教中图版必修一

2021-12-27

| 6页

| 1321人阅读

| 411人下载

普通

资源信息

学段	高中
学科	信息技术
教材版本	高中信息技术人教/中图版必修1 数据与计算
年级	高一
章节	2.4.3 算法与程序实现的综合应用
类型	教案
知识点	-
使用场景	同步教学
学年	2021-2022
地区（省份）	全国
地区（市）	-
地区（区县）	-
文件格式	DOC
文件大小	605 KB
发布时间	2021-12-27
更新时间	2021-12-27
作者	xkw_057035942
品牌系列	-
审核时间	2021-12-27
下载链接	https://m.zxxk.com/soft/31962226.html
价格	0.00储值（1储值=1元）
来源	学科网

内容正文：

2021—2022学年人教中图版必修一 2.4 算法与程序综合应用之Python语言中jieba库的应用一、jieba库基本介绍 (1)、jieba库概述 jieba是优秀的中文分词第三方库 - 中文文本需要通过分词获得单个的词语 - jieba是优秀的中文分词第三方库，需要额外安装 - jieba库提供三种分词模式，最简单只需掌握一个函数 (2)、jieba分词的原理 Jieba分词依靠中文词库 - 利用一个中文词库，确定汉字之间的关联概率 - 汉字间概率大的组成词组，形成分词结果 - 除了分词，用户还可以添加自定义的词组二、jieba库使用说明 (1)、jieba分词的三种模式精确模式、全模式、搜索引擎模式 - 精确模式：把文本精确的切分开，不存在冗余单词 - 全模式：把文本中所有可能的词语都扫描出来，有冗余 - 搜索引擎模式：在精确模式基础上，对长词再次切分 (2)、jieba库常用函数三、jieba应用实例四、利用jieba库统计三国演义中任务的出场次数 import jieba txt = open("D:\\三国演义.txt", "r", encoding='utf-8').read() words = jieba.lcut(txt) # 使用精确模式对文本进行分词 counts = {} # 通过键值对的形式存储词语及其出现的次数 for word in words: if len(word) == 1: # 单个词语不计算在内 continue else: counts[word] = counts.get(word, 0) + 1 # 遍历所有词语，每出现一次其对应的值加 1 items = list(counts.items())#将键值对转换成列表 items.sort(key=lambda x: x[1], reverse=True) # 根据词语出现的次数进行从大到小排序 for i i

2.4 算法与程序综合应用之Python语言中jieba库的应用 2021—2022学年人教中图版必修一

资源信息

内容正文：

资源预览图