内容正文:
2025 年 7 月浙江省普通高中学业水平考试
信 息 技 术
考生注意:
1.答题前,请务必将自己的姓名、准考证号用黑色字迹的签字笔或钢笔分别填写在试题卷和答题纸规定的位置上。
2.答题时,请按照答题纸上“注意事项”的要求,在答题纸相应的位置上规范作答,在本试题卷上的作答一律无效。
3.非选择题的答案必须使用黑色字迹的签字笔或钢笔写在答题纸上相应区域内,作图时可先用2B铅笔,确定后必须使用黑色字迹的签字笔或钢笔描黑,答案写在本试题卷上无效。
一、选择题(本大题共9小题,每小题3分,共27分。每小题列出的四个备选项中只有一个是符合题目要求的,不选、多选、错选均不得分)
1. 某市为打造“智能安防预警系统”,在该市的各个公共区域部署了智能摄像头、红外传感器等设备,并通过4G/5G、光纤专线等将数据传输至服务器,系统对获取的海量安防数据进行实时分析与处理,如果发现存在安全隐患,警情响应系统会自动向相应的终端设备发送警报信息。关于该系统中安防数据的描述,正确的是( )
A. 都结构化数据 B. 不能通过有线网络传输
C. 只有视频这一种表现形式 D. 能为预判安全隐患提供依据
【答案】D
【解析】
【详解】本题考查数据。智能摄像头、红外传感器等设备获取的数据有结构化数据,也有非结构化数据,如视频图像等;数据可通过光纤专线等有线网络传输;数据表现形式不只有视频,还有红外传感器获取的信息等;系统对获取的海量安防数据进行实时分析与处理,发现安全隐患,说明这些数据能为预判安全隐患提供依据。故答案为:D。
2. 某市为打造“智能安防预警系统”,在该市的各个公共区域部署了智能摄像头、红外传感器等设备,并通过4G/5G、光纤专线等将数据传输至服务器,系统对获取的海量安防数据进行实时分析与处理,如果发现存在安全隐患,警情响应系统会自动向相应的终端设备发送警报信息。下列体现了该系统数据加工处理功能的是( )
A. 红外传感器采集数据 B. 挖掘安防数据辅助决策
C. 服务器存储各类数据 D. 警报信息发送至终端
【答案】B
【解析】
【详解】本题考查数据处理相关内容。红外传感器采集数据属于数据采集,不是加工处理。挖掘安防数据辅助决策是对数据进行分析挖掘,属于数据加工处理。服务器存储各类数据属于数据存储,不是加工处理。警报信息发送至终端属于数据传输/输出,不是加工处理。故本题答案是B选项。
3. 某个摄像头拍摄了一段存储容量为4GB 的视频,按20:1进行压缩,再平均分割成20个视频小片段上传服务器,则每个视频小片段的存储容量约为( )
A. 10MB B. 10KB C. 20MB D. 20KB
【答案】A
【解析】
【详解】本题考查的是数字化。首先,视频原存储容量为4GB ,按 20:1 压缩后,压缩后的容量为 4GB÷20=0.2GB 。因为 1GB=1024MB ,所以 0.2GB=0.2×1024MB=204.8MB 。再将压缩后的视频平均分割成 20 个视频小片段,那么每个小片段的存储容量约为 204.8MB÷20≈10MB 。故选A。
4. 某零售店推出智能购物手推车,支持实时计价和自助结账。手推车配备触摸屏、能自动称重的内置秤和集成AI 算法的智能摄像头等设备。智能摄像头识别商品后,系统通过网络从服务器数据库中获取该商品的信息,并在触摸屏上显示商品信息及累计金额。用户可直接在触摸屏上确认账单,完成手机扫码支付后,系统生成电子购物凭证。下列属于该零售店购物系统硬件的是( )
①智能摄像头 ②内置秤 ③触摸屏 ④数据库 ⑤电子购物凭证
A. ①②③ B. ②③④ C. ③④⑤ D. ①③⑤
【答案】A
【解析】
【详解】本题考查信息系统的组成。硬件是指计算机系统中物理存在的设备,①智能摄像头、②内置秤、③触摸屏均为实际存在的物理设备,属于硬件;④数据库是存储数据的软件系统,⑤电子购物凭证是系统生成的电子数据,二者均不属于硬件。因此,本题选择A选项。
5. 某零售店推出智能购物手推车,支持实时计价和自助结账。手推车配备触摸屏、能自动称重的内置秤和集成AI 算法的智能摄像头等设备。智能摄像头识别商品后,系统通过网络从服务器数据库中获取该商品的信息,并在触摸屏上显示商品信息及累计金额。用户可直接在触摸屏上确认账单,完成手机扫码支付后,系统生成电子购物凭证。系统有时会出现商品识别错误的情形,下列原因分析中不可能的是( )
A. 商品外形相似度太高 B. AI算法训练数据不足
C. 商品单价随市场调整 D. 环境光线影响影像质量
【答案】C
【解析】
【详解】本题考查人工智能相关内容。单价变化是在服务器数据库里更新的,不影响摄像头视觉识别环节,因此不会造成识别错误。商品外形相似度太高可能导致识别错误;AI算法训练数据不足会导致模型识别不准;环境光线影响影像质量会导致识别错误。故本题答案是C选项。
6. 某零售店推出智能购物手推车,支持实时计价和自助结账。手推车配备触摸屏、能自动称重的内置秤和集成AI 算法的智能摄像头等设备。智能摄像头识别商品后,系统通过网络从服务器数据库中获取该商品的信息,并在触摸屏上显示商品信息及累计金额。用户可直接在触摸屏上确认账单,完成手机扫码支付后,系统生成电子购物凭证。下列顾客和商家的做法中,有利于信息安全的是( )
A. 商家向供应商共享用户的消费数据 B. 商家以明文方式保存用户数据
C. 顾客使用公共Wi-Fi进行扫码支付 D. 顾客输入支付密码时防止旁窥
【答案】D
【解析】
【详解】本题考查信息安全。A选项错误,商家未经用户授权向供应商共享消费数据,会泄露用户隐私,违背信息安全中数据保密的原则。B选项错误,以明文方式保存用户数据,数据未经过加密处理,一旦数据库被非法访问,用户信息会直接被窃取,存在严重安全隐患。C选项错误,公共Wi-Fi的安全性通常较低,易被第三方监听或拦截数据传输,使用其进行扫码支付可能导致支付信息泄露。D选项正确,顾客输入支付密码时防止旁窥,能避免密码被他人非法获取,有效保护支付环节的信息安全。因此,本题选择D选项。
7. 某零售店推出智能购物手推车,支持实时计价和自助结账。手推车配备触摸屏、能自动称重的内置秤和集成AI 算法的智能摄像头等设备。智能摄像头识别商品后,系统通过网络从服务器数据库中获取该商品的信息,并在触摸屏上显示商品信息及累计金额。用户可直接在触摸屏上确认账单,完成手机扫码支付后,系统生成电子购物凭证。智能购物手推车完成实时计价主要包括以下步骤:
①查询数据库,获取商品信息
②实时计算总价,并显示触摸屏上
③智能摄像头识别商品,并将数据实时传输到服务器
正确的流程是( )
A. ①②③ B. ①③② C. ③①② D. ③②①
【答案】C
【解析】
【详解】本题考查的是物联网的应用。智能购物手推车实时计价的流程,首先是③智能摄像头识别商品,并将数据实时传输到服务器;然后①查询数据库,获取商品信息;最后②实时计算总价,并显示在触摸屏上。所以正确流程是③①②,选 C。
8. 某零售店推出智能购物手推车,支持实时计价和自助结账。手推车配备触摸屏、能自动称重的内置秤和集成AI 算法的智能摄像头等设备。智能摄像头识别商品后,系统通过网络从服务器数据库中获取该商品的信息,并在触摸屏上显示商品信息及累计金额。用户可直接在触摸屏上确认账单,完成手机扫码支付后,系统生成电子购物凭证。该店推出购物优惠活动:购物消费金额s 达到100元或商品种类n 满5种,消费金额s 打9折。下列 Python 程序段能实现按该规则计价的是( )
①d=1
if s >= 100 and n >= 5:
d=0.9
print("金额:",s*d)
②d=1
if s >= 100 or n >= 5:
d=0.9
print("金额:",s*d)
③d=1
if s >= 100:
d=0.9
elif n >= 5:
d=0.9
print("金额:",s*d)
④d=1
if s >= 100:
d=0.9
if n >= 5:
d=0.9
print("金额:",s*d)
A. ①②③ B. ②③④ C. ①②④ D. ①③④
【答案】B
【解析】
【详解】本题考查Python分支结构。根据题目优惠规则,当消费金额 s 达到 100 元 或 商品种类 n 满 5 种时,才打 9 折,因此逻辑应使用“或”(or)而非“与”(and),并且需要保证只要任一条件满足就能应用折扣。程序①使用了 and,只有两者同时满足才打折,不符合规则;程序②使用 or,只要任一条件满足就打折,符合规则;程序③用 elif 分支,也能在任一条件满足时打折,符合规则;程序④虽然使用两个独立的 if,但最终效果也是只要任一条件成立就打折,也符合规则。因此正确答案是②、③、④。故答案为:B。
9. 某 Python 程序段如下:
a=[6,8,6,5,3,4]
total=0;pos=-1;c=0
for i in range(len(a)):
total=total+a[i]
c=c+1
if c >= 4:
if total >= 20:
pos=i
total=total-a[i-3]
print(pos)
该程序段运行后,输出的结果是( )
A. 5 B. 4 C. 3 D. -1
【答案】B
【解析】
【详解】本题考查Python程序设计。程序通过循环遍历列表a,累计元素和total并计数c,当c≥4时,检查total是否≥20,若满足则将当前索引i赋值给pos,同时total减去3个元素前的值以维持最近4个元素的和。具体执行:i=0到2时,c分别为1、2、3,均小于4,不进入条件;i=3时,c=4,total=6+8+6+5=25≥20,pos=3,随后total=25-6=19;i=4时,c=5,total=19+3=22≥20,pos=4,随后total=22-8=14;i=5时,c=6,total=14+4=18<20,pos不变。最终pos为4。因此,本题选择B选项。
二、非选择题(本大题共2小题,每小题10分,共20分)
10. 某研究小组开发“食堂就餐管理系统”,其页面规划如图 a 所示,用户可通过浏览器查询、 管理数据等。请回答下列问题:
(1)用户查看账单时,访问的子页面地址是 http://192.168.0.11:5000/____。
(2)除了图a所示子页面外,为该系统再设计1个子页面4,并简要说明其功能。/____
图a
(3)研究小组将四月份数据导出到文件data.xlsx,部分数据如图b所示,统计该月每天午餐时间套餐 A、套餐B、套餐C的消费数量,并绘制折线图,如图c所示。
图b
图c
实现该功能的部分Python 程序如下,请选择合适的代码填入划线处(单选)。
import pandas as pd #导入 pandas 模块
import matplotlib.pyplot as plt #导入matplotlib 绘图库的pyplot子库
df=pd.read_excel("data.xlsx") #读取文件中的数据
df1=df[df["餐次"]=="午"] #筛选
tcz=[" 套餐A"," 套餐B"," 套餐C"]
for tc in tcz:
①____
②____
#绘制 tc 的折线图,代码略
#显示如图c 所示的折线图,代码略
①和②处可选的代码有:
A.df2=df1[df1["套餐"]== tc]
B.df2=df1[df1["套餐类别"]== tc]
C.df2=df2.groupby("日",as_index=False).数量.sum() #分组统计
(4)观察图c,从整体上看,午餐最受欢迎的套餐类别是____。
【答案】 ①. view ②. 套餐管理;套餐删除、增加、修改功能(或其他合理答案); ③. B ④. C ⑤. 套餐C
【解析】
【详解】本题考查信息系统搭建及数据分析。
(1)根据图a所示,用户查看账单的功能对应系统的账单查询页面,会以 /view 作为路径。访问该地址即可展示个人或全部消费记录。故答案为:view。
(2)新增的子页面如“套餐管理”用于管理员对系统中的套餐进行维护,包括增加、删除和修改操作,能够方便管理食堂菜单,确保菜单信息完整且及时更新,提高系统管理效率。
(3)在循环中,需筛选出当前套餐类别的数据,使用 df2 = df1[df1["套餐"] == tc] 可以从午餐数据中提取出套餐A、B或C对应的数据,为后续统计每日数量做准备。故答案为:B。为了统计每天该套餐的销售数量,使用 df2 = df2.groupby("日", as_index=False).数量.sum() 对筛选后的数据按日期分组求和,从而得到每日销量,为绘制折线图提供数据依据。故答案为:C。
(4)观察折线图可发现,套餐C的每日销量大部分时间高于套餐A和套餐B,因此从整体趋势看,午餐最受欢迎的套餐类别是套餐C。故答案为:套餐C。
11. 就餐用户评价数据经预处理后仅包含汉字和空格,示例数据如图所示。研究小组采用分词方法,对评价数据逐字遍历并按指定长度拆分,以统计高频词。例如:某评语为“红烧肉 甜咸适中”,若按长为2进行分词,结果为“红烧”“烧肉”“甜咸”“咸适”“适中”,每个双字词频次为1。
请回答下列问题:
(1)如图所示的评价数据中,频次最高的双字词有:____,频次为____
(2)为实现分词并统计每个词的频次,定义函数wcount(fname,wlen),请在划线处填入合适的代码。
def wcount(fname, wlen): #fname为评价数据文件名,wlen为分词长度
file = open(fname,"r",encoding="utf-8") # 打开文件
dic = {}
line = file.readline().strip() # 读取文件中的一行并去除换行符
space = "" # space为1个空格
while line: # 当line非空
for i in range(len(line) - wlen + 1):
word =____
if not space in word:
if word in dic:
dic[word] = dic[word] + 1
else:
dic[word] = 1
line = file.readline().strip()
return dic
(3)列表words中存储了分词后的词及相应的频次,定义函数findmax(words, n),找出频次为前n名的所有词。例如:words中排名前2的频次分别为80和50,对应的词分别有13个和6个,则共有19个频次为前2的词。请在划线处填入合适的代码。
def findmax(words, n):
mword = []
m1 = 100000 # 设置初始值
for i in range(n):
m2 = 0
for j in range(len(words)):
if m2 < words[j][1] < m1:
____
for j in range(len(words)):
if words[j][1] == m2:
mword.append(words[j][0]) # 在列表mword中添加一个元素
m1 = m2
return mword
(4)主程序如下,请在划线处填入合适的代码。
# 将用户评价数据预处理后,保存在文件data.txt中,代码略
fname = "datatxt"
wlen = 2
wdic =____ # wdic用于存储按wlen长度分词后得到的词及其频次
"""
将字典wdic转换为列表words,如:words=["美味", 80], ["香甜", 50], ……],其中,words[O][O]存储词“美味”,words[O][1]存储频次80,代码略
"""
n = 10 # 频次前n名
result = findmax(words, n)
print(result)
【答案】 ①. 鲜美;新鲜 ②. 2 ③. line[i:i+wlen] ④. m2=words[j][1] ⑤. wcount(fname,wlen)
【解析】
【详解】本题考查Python应用。
(1)由图可知,频次最高的双字词有:鲜美、新鲜,频次为2。故答案为:鲜美;新鲜,2。
(2)line[i:i+wlen] 会截取从索引i开始的wlen个字符,即长度为2的双字词。循环会遍历整行,得到所有连续双字词。故答案为:line[i:i+wlen]。
(3)这一行在循环中找到小于上一次最大值m1且比当前m2大的频次,保证每轮找到第i大的频次。故答案为:m2=words[j][1]。
(4)wcount(fname, wlen) 会返回一个字典,键是分词后的词,值是该词的频次,将其赋给wdic以供后续转换为列表words并进行前n频次统计。故答案为:wcount(fname,wlen)。
第1页/共1页
学科网(北京)股份有限公司
$
2025 年 7 月浙江省普通高中学业水平考试
信 息 技 术
考生注意:
1.答题前,请务必将自己的姓名、准考证号用黑色字迹的签字笔或钢笔分别填写在试题卷和答题纸规定的位置上。
2.答题时,请按照答题纸上“注意事项”的要求,在答题纸相应的位置上规范作答,在本试题卷上的作答一律无效。
3.非选择题的答案必须使用黑色字迹的签字笔或钢笔写在答题纸上相应区域内,作图时可先用2B铅笔,确定后必须使用黑色字迹的签字笔或钢笔描黑,答案写在本试题卷上无效。
一、选择题(本大题共9小题,每小题3分,共27分。每小题列出的四个备选项中只有一个是符合题目要求的,不选、多选、错选均不得分)
1. 某市为打造“智能安防预警系统”,在该市的各个公共区域部署了智能摄像头、红外传感器等设备,并通过4G/5G、光纤专线等将数据传输至服务器,系统对获取的海量安防数据进行实时分析与处理,如果发现存在安全隐患,警情响应系统会自动向相应的终端设备发送警报信息。关于该系统中安防数据的描述,正确的是( )
A. 都是结构化数据 B. 不能通过有线网络传输
C. 只有视频这一种表现形式 D. 能为预判安全隐患提供依据
2. 某市为打造“智能安防预警系统”,在该市的各个公共区域部署了智能摄像头、红外传感器等设备,并通过4G/5G、光纤专线等将数据传输至服务器,系统对获取的海量安防数据进行实时分析与处理,如果发现存在安全隐患,警情响应系统会自动向相应的终端设备发送警报信息。下列体现了该系统数据加工处理功能的是( )
A. 红外传感器采集数据 B. 挖掘安防数据辅助决策
C. 服务器存储各类数据 D. 警报信息发送至终端
3. 某个摄像头拍摄了一段存储容量为4GB 的视频,按20:1进行压缩,再平均分割成20个视频小片段上传服务器,则每个视频小片段的存储容量约为( )
A. 10MB B. 10KB C. 20MB D. 20KB
4. 某零售店推出智能购物手推车,支持实时计价和自助结账。手推车配备触摸屏、能自动称重的内置秤和集成AI 算法的智能摄像头等设备。智能摄像头识别商品后,系统通过网络从服务器数据库中获取该商品的信息,并在触摸屏上显示商品信息及累计金额。用户可直接在触摸屏上确认账单,完成手机扫码支付后,系统生成电子购物凭证。下列属于该零售店购物系统硬件的是( )
①智能摄像头 ②内置秤 ③触摸屏 ④数据库 ⑤电子购物凭证
A. ①②③ B. ②③④ C. ③④⑤ D. ①③⑤
5. 某零售店推出智能购物手推车,支持实时计价和自助结账。手推车配备触摸屏、能自动称重内置秤和集成AI 算法的智能摄像头等设备。智能摄像头识别商品后,系统通过网络从服务器数据库中获取该商品的信息,并在触摸屏上显示商品信息及累计金额。用户可直接在触摸屏上确认账单,完成手机扫码支付后,系统生成电子购物凭证。系统有时会出现商品识别错误的情形,下列原因分析中不可能的是( )
A. 商品外形相似度太高 B. AI算法训练数据不足
C. 商品单价随市场调整 D. 环境光线影响影像质量
6. 某零售店推出智能购物手推车,支持实时计价和自助结账。手推车配备触摸屏、能自动称重的内置秤和集成AI 算法的智能摄像头等设备。智能摄像头识别商品后,系统通过网络从服务器数据库中获取该商品的信息,并在触摸屏上显示商品信息及累计金额。用户可直接在触摸屏上确认账单,完成手机扫码支付后,系统生成电子购物凭证。下列顾客和商家的做法中,有利于信息安全的是( )
A. 商家向供应商共享用户的消费数据 B. 商家以明文方式保存用户数据
C 顾客使用公共Wi-Fi进行扫码支付 D. 顾客输入支付密码时防止旁窥
7. 某零售店推出智能购物手推车,支持实时计价和自助结账。手推车配备触摸屏、能自动称重的内置秤和集成AI 算法的智能摄像头等设备。智能摄像头识别商品后,系统通过网络从服务器数据库中获取该商品的信息,并在触摸屏上显示商品信息及累计金额。用户可直接在触摸屏上确认账单,完成手机扫码支付后,系统生成电子购物凭证。智能购物手推车完成实时计价主要包括以下步骤:
①查询数据库,获取商品信息
②实时计算总价,并显示在触摸屏上
③智能摄像头识别商品,并将数据实时传输到服务器
正确的流程是( )
A. ①②③ B. ①③② C. ③①② D. ③②①
8. 某零售店推出智能购物手推车,支持实时计价和自助结账。手推车配备触摸屏、能自动称重的内置秤和集成AI 算法的智能摄像头等设备。智能摄像头识别商品后,系统通过网络从服务器数据库中获取该商品的信息,并在触摸屏上显示商品信息及累计金额。用户可直接在触摸屏上确认账单,完成手机扫码支付后,系统生成电子购物凭证。该店推出购物优惠活动:购物消费金额s 达到100元或商品种类n 满5种,消费金额s 打9折。下列 Python 程序段能实现按该规则计价的是( )
①d=1
if s >= 100 and n >= 5:
d=0.9
print("金额:",s*d)
②d=1
if s >= 100 or n >= 5:
d=0.9
print("金额:",s*d)
③d=1
if s >= 100:
d=0.9
elif n >= 5:
d=0.9
print("金额:",s*d)
④d=1
if s >= 100:
d=0.9
if n >= 5:
d=0.9
print("金额:"s*d)
A. ①②③ B. ②③④ C. ①②④ D. ①③④
9. 某 Python 程序段如下:
a=[6,8,6,5,3,4]
total=0;pos=-1;c=0
for i in range(len(a)):
total=total+a[i]
c=c+1
if c >= 4:
if total >= 20:
pos=i
total=total-a[i-3]
print(pos)
该程序段运行后,输出的结果是( )
A. 5 B. 4 C. 3 D. -1
二、非选择题(本大题共2小题,每小题10分,共20分)
10. 某研究小组开发“食堂就餐管理系统”,其页面规划如图 a 所示,用户可通过浏览器查询、 管理数据等。请回答下列问题:
(1)用户查看账单时,访问的子页面地址是 http://192.168.0.11:5000/____。
(2)除了图a所示的子页面外,为该系统再设计1个子页面4,并简要说明其功能。/____
图a
(3)研究小组将四月份数据导出到文件data.xlsx,部分数据如图b所示,统计该月每天午餐时间套餐 A、套餐B、套餐C的消费数量,并绘制折线图,如图c所示。
图b
图c
实现该功能的部分Python 程序如下,请选择合适的代码填入划线处(单选)。
import pandas as pd #导入 pandas 模块
import matplotlib.pyplot as plt #导入matplotlib 绘图库的pyplot子库
df=pd.read_excel("data.xlsx") #读取文件中的数据
df1=df[df["餐次"]=="午"] #筛选
tcz=[" 套餐A"," 套餐B"," 套餐C"]
for tc in tcz:
①____
②____
#绘制 tc 的折线图,代码略
#显示如图c 所示的折线图,代码略
①和②处可选的代码有:
A.df2=df1[df1["套餐"]== tc]
Bdf2=df1[df1["套餐类别"]== tc]
C.df2=df2.groupby("日",as_index=False).数量.sum() #分组统计
(4)观察图c,从整体上看,午餐最受欢迎的套餐类别是____。
11. 就餐用户的评价数据经预处理后仅包含汉字和空格,示例数据如图所示。研究小组采用分词方法,对评价数据逐字遍历并按指定长度拆分,以统计高频词。例如:某评语为“红烧肉 甜咸适中”,若按长为2进行分词,结果为“红烧”“烧肉”“甜咸”“咸适”“适中”,每个双字词频次为1。
请回答下列问题:
(1)如图所示的评价数据中,频次最高的双字词有:____,频次为____
(2)为实现分词并统计每个词的频次,定义函数wcount(fname,wlen),请在划线处填入合适的代码。
def wcount(fname, wlen): #fname为评价数据文件名,wlen为分词长度
file = open(fname,"r",encoding="utf-8") # 打开文件
dic = {}
line = file.readline().strip() # 读取文件中的一行并去除换行符
space = "" # space为1个空格
while line: # 当line非空
for i in range(len(line) - wlen + 1):
word =____
if not space in word:
if word in dic:
dic[word] = dic[word] + 1
else:
dic[word] = 1
line = file.readline().strip()
return dic
(3)列表words中存储了分词后的词及相应的频次,定义函数findmax(words, n),找出频次为前n名的所有词。例如:words中排名前2的频次分别为80和50,对应的词分别有13个和6个,则共有19个频次为前2的词。请在划线处填入合适的代码。
def findmax(words, n):
mword = []
m1 = 100000 # 设置初始值
for i in range(n):
m2 = 0
for j in range(len(words)):
if m2 < words[j][1] < m1:
____
for j in range(len(words)):
if words[j][1] == m2:
mword.append(words[j][0]) # 列表mword中添加一个元素
m1 = m2
return mword
(4)主程序如下,请在划线处填入合适的代码。
# 将用户评价数据预处理后,保存在文件data.txt中,代码略
fname = "data.txt"
wlen = 2
wdic =____ # wdic用于存储按wlen长度分词后得到的词及其频次
"""
将字典wdic转换为列表words,如:words=["美味", 80], ["香甜", 50], ……],其中,words[O][O]存储词“美味”,words[O][1]存储频次80,代码略
"""
n = 10 # 频次前n名
result = findmax(words, n)
print(result)
第1页/共1页
学科网(北京)股份有限公司
$