内容正文:
优
盛
文
化
第 1 页(共4页)
过关检测与评价(I)卷
(一)论述类文本阅读(共 3个小题,9分)
(2021 年高考 全国乙卷)阅读下面的文字,完成
1 ~ 3 题。
对于人文研究来说,计算方法以往只是作为辅助手段
而存在的,而今天已取得了不可替代的地位。一种新的人
文研究形态应运而生,这就是“数字人文”。学者莫莱蒂
曾设想一种建立在全部文学文本之上的世界文学研究,人
们必须借助计算机对大规模的文学文本集合进行采样、统
计、图绘、分类,描述文学史的总体特征,然后再做文学
评论式的解读。为此,他提出了与“细读”相对的“远读”
作为方法论。弄清计算机的远读与人的细读之间的差别,
不仅能使我们清晰地界定计算方法在人文研究中的作用,
而且可以帮助我们重新确立人的阅读的价值。
计算机是为科学计算而创造出来的,擅长的是“计数”,
而非理解。要处理自然语言文本,计算机必须先将文本置
换成便于计数的词汇集合,或者用更复杂的代数模型和概
率模型来表示文本,这一过程被称为“数据化”。数据化
之后所得到的文本替代物(集合、向量、概率)虽然损失
了原始文本的丰富语义,但终究是可以计算的了。不过,
尽管计算机能处理海量的语料,执行复杂的统计、分类、
查询等任务,但它并不能理解文本的内容。
远读是数字人文的基石。大规模的文本集合上的远读,
基本可以归为两类:一是对文本集合整体统计特征的描述,
一是对文本集合内在结构特征的揭示。例如,数字人文学者
米歇尔等人对数百万册数字化图书进行多种词汇和词频统
计,以分析英语世界的语言演变,这属于前者;莫莱蒂用地
图、树结构来分别展示文学作品的地理特征和侦探故事的类
型结构,这属于后者。无论是宏观统计描述还是内在结构揭
示,都是超越文本具体内容的抽象表示,所得结果都是需要
解读的。正如米歇尔所说,在巨量文本集合上得到的统计分
析结果,为人文材料的宏观研究提供了证据;但是要解读这
些证据,就像分析古代生物化石一样,是有挑战性的。对远
读结果的解读,仍然要依赖学者在细读文本的基础上所建立
起来的对本领域的认知和理解。一句话,人的阅读不可替代。
需要补充的是,当考查单篇文本的文本特征(例如计
算一篇文档中所有单字的出现频率),或者分析其内部结
构(例如提取一部小说中所有人物的对话网络)时,数据
量也会增长到个人无法处理的程度。所以,上述对文本集
合所做的讨论在单篇文本层面也是成立的。
一个普遍存在的对数字人文的评判依据,是看数字人
文能不能更好地回答传统人文学者所关心的问题。严格说
来,只有当数据量或者数据精度超出了个人阅读理解的能
力范围时,才有理由借助计算机来对文本或者文本集合的
特征予以量化描述,进而提供给人去进行深入解读。数字
人文不仅仅是新的手段和方法,更重要的是,它赋予我们
提出新问题的能力。我们现在可以问,五千年来全人类使
用最频繁的词是什么。透过这类问题,可以获得观察超长
历史时段文化现象的新视角。
(摘编自王军《从人文计算到可视化——数字人文的
发展脉络梳理》)
1. 下列关于原文内容的理解和分析,不正确的一项是(3
分)( )
A. 在数字人文的概念提出之前,计算方法已被引入人文
领域,在研究中发挥作用。
B. 要实现莫莱蒂设想的世界文学研究,首先应进行大规
模的文学文本集合的数据化。
C. 选择远读还是细读的方法,取决于阅读的对象是大规
模的文本集合还是单篇文本。
D. 数字人文不但为文本处理提供了新的手段和方法,而
且为人文研究提供了新视角。
2. 下列对原文论证的相关分析,不正确的一项是(3 分)
( )
A. 文章区分“计数”与“理解”,是为了论证计算机不
能处理某些特定类型的文本。
B. 文章转述数字人文学者米歇尔本人的说法,有助于论
证应该更全面地看待远读。
C. 文章第四段讨论单篇文本层面的问题,对前文补充论
证,使得论证更加周密。
D. 文章同时肯定计算机远读和人的细读的作用,有助于
避免人们对远读的误解。
3. 根据原文内容,下列说法正确的一项是(3 分)( )
A. 人文研究的主体,在数字人文中实现了从具体的学者
个人向计算机的转变。
B. 远读不是要深化对文本内容的理解,而是要发掘文本
集合的共同形式特征。
C. 数字人文的价值,在于将历史上未被注意和阅读的文
本都进行数据化并做研究。
D. 和人的细读相比,远读的理念和做法体现出大数据时
代文理融合的跨学科取向。
(二)实用类文本阅读(共 3个小题,12分)
(河南省九师联盟 2021 届高三下学期 5 月联考)阅
读下面的文字,完成 4 ~ 6 题。
《涧溪春晓》是人民日报记者徐锦庚撰写的长篇报告
文学,文章报道了济南市章丘区三涧溪村脱贫致富的故事,
在徐锦庚眼中,三涧溪就是中国乡村的缩影。文本展示的
既是一位村