论文导读::提高阅读理解能力是实现教学目的的重要方面。从上面的分类可以看出内容效度是内部效度的一种。
关键词:英语专业四级考试,阅读理解,内容效度
1.引言
高校英语专业四级考试(TEM4)是国内专为英语专业学生基础阶段实施的大规模标准化语言测试。自1990年中国实施该项考试以来,TEM已经成为衡量英语专业教与学的重要标准。近年来,由于其科学的命题方法、规范的评分标准、有力的政策保证,TEM的影响力逐步增加,现已逐渐向国际标准靠拢,同时在国内的认可度也很高。因此,对于TEM考试的发展给予更多的关注是必要的。
阅读作为一项重要的语言学习技能,对于英语教与学(包括英语专业及非英语专业)极其重要。在英语教学中英语专业四级考试,提高阅读理解能力是实现教学目的的重要方面。与此同时,阅读理解作为习得语言的重要途径一直都是非常重要的。随着科学技术的发展以及世界通用语(global language)的进步,在中国,第二语言阅读能力亟待提高。
Bachman & Palmer[1]18指出“信度(reliability)和效度(validity)是语言测试的两大重要指标”。语言测试的信度通常很容易通过统计分析得出,因为它相对稳定;然而效度却比信度复杂得多。Hughes[2]22对效度作了如下定义:“效度是指测试者(tester)能测试所希望测试到的东西的程度”,李筱菊[3]也同意这一看法。Alderson, Clapham & Wall[4]使用了内部效度(internal validity)和外部效度(externalvalidity)来描述不同类型的效度中国论文网。内部效度包括表面效度(face validity)、内容效度(content validity)和回答的有效性(response validity);而外部效度则由共时效度(concurrent validity)和预测效度(predictivevalidity)组成[4]171。从上面的分类可以看出内容效度是内部效度的一种。
内容效度是指“测试是否能足够代表或者说在多大程度上代表了所要测试的内容”[5]94。Bachman[6]指出内容效度通常包括内容相关度(content relevance)和内容覆盖度(content coverage)两方面。内容效度是语言教学与学习的重要方面,Hughes[2]27称“测试的内容效度越高,该测试就越有可能准确地测试所要测试的内容”。一种用来测试内容效度比较常用的方法就是把测试与有关测试内容的说明进行对比,这些内容说明包括考试大纲、教学大纲或是特定学科领域的具体说明[4]。
考虑到TEM4的重要性以及阅读理解能力在英语学习中承担的重要角色,有必要对于阅读理解测试部分的发展情况给予更多的关注并进行相应的评估。本研究旨在对2009年的TEM4阅读理解部分的内容效度进行研究,同时针对命题中反映出的问题提出了建议,以期对于提高试题质量有所帮助。
2.TEM4 阅读理解测试内容效度分析
本文以Bachman& Palmer[1]提出的任务特性(Task Characteristics)为理论依据,结合《高校英语专业四级考试大纲(2004年新版)》[7](以下简称《大纲》)对2009年的TEM4阅读理解部分的内容效度进行研究。然而将任务特性这一理论应用于阅读测试时存在着一定的不足,正如Bachman & Palmer[1]所说的他们并没有打算规定测试任务的特定类型以及任务特性。因此,考虑到阅读测试的特性,本文以下的分析将从任务特性框架中的“输入特性”(Characteristics of the Input)和“预期回答特性”(Characteristicsof the Expected Response)两个角度进行。
2.1 输入特性
Bachman[8]125指出“输入是指期望应试者回答的特定测试任务中隐含的信息”。输入特性包括长度、速度、生词、易读度、题材以及体裁[8]。为了便于讨论分析英语专业四级考试,本文将这六部分分成以下三类:阅读速度(长度和速度)、语言难度(生词和易读度)和语篇类型(题材和体裁)。
2.1.1 阅读速度
几乎所有的测试者都会考虑的问题就是阅读理解的测试长度怎样才是合理的。杨惠中 & Weir[9]提出“试卷的设计者要考虑受试者做阅读理解题的实际情况,即既要阅读文章又要回答问题或作出选择,因此对于阅读文章和答题要作出适当比例的区分”。《大纲》对TEM4阅读理解有如下要求:“既要求准确性,也要求一定的速度。阅读材料共长1800个单词左右,考试时间25分钟。阅读速度为每分钟120个单词。”本文经过仔细的计算得出TEM4(2009)阅读理解部分的文章总字数、问题字数及指令字数,同时结合大纲要求,阅读速度也计算出来。(见下表)
表2.1 TEM4 (2009)阅读长度及阅读速度
文章材料总字数
|
题目字数
|
指令字数
|
阅读部分总长度
|
时间规定
|
阅读速度
|
1843词
|
758词
|
41词
|
2642词
|
25分
|
106词/分
|
从表2.1可以看出,文章材料总字数是1843,基本符合《大纲》对于阅读材料的字数要求。此外,阅读速度由阅读部分总长度除以规定的时间得出为106词每分,这一速度与《大纲》对于阅读速度的规定有一定差距,但是这样可以确保受试者有足够的时间回答问题。总的来看,阅读速度(长度和速度)与大纲的规定基本一致,但还有很大的提高空间。
2.1.2 语言难度
对于语言难度,《大纲》规定“阅读材料的语言难度中等, 关键词汇基本上不超出《大纲》规定的范围。”实际上,这里涉及的是生词以及易读度的问题中国论文网。易读度指英语文本易于阅读和理解的程度或性质,是应用语言学的重要概念。易读度通常被认为是篇章结构与词汇难度的结合英语专业四级考试,主要受语言形式(如句子长度、生词等)的影响。既然生词时影响易读度的重要因素之一,本节试图分析TEM4(2009)阅读理解部分各篇文章的易读度,从而解读阅读部分的语言难易程度。前人对于易读度的研究已经付出了很多努力,提出了许多计算易读度的方式,如SMOG指数, Fry文章难度测试公式,Flesh易读度测试公式等。这些方法的共同目的都是试图为测试文章难易程度提供简单易操作的方式。在众多方法中,由Flesh[10]于1948年提出使用的易读度公式至今仍在测试领域中频繁使用。鉴于此,本文采用Flesh公式对阅读理解的易读度进行计算分析。该公式如下:RE=206.835-(0.846×NSYLL)-(1.015×W/S), 其中RE表示易读度,NSYLL是每100个单词的音节数,W/S每个句子的平均单词数。经过计算,TEM4(2009)阅读理解部分各篇文章的易读度如下:
表 2.2 TEM4 (2009)阅读理解易读度
Text A
|
Text B
|
Text C
|
Text D
|
平均值
|
65.06
|
62.20
|
74.85
|
53.75
|
63.97
|
表 2.3 易读度参考量表(Reference table of readability)
Score
|
Description of style
|
Typical magazine
|
Potential audience
|
School grade
|
% of US Adults
|
0-30
|
Very difficult
|
Scientific
|
College
|
4.5
|
30-50
|
Difficult
|
Academic
|
High school
|
24
|
50-60
|
Fairly difficult
|
Quality
|
Some H.S.
|
40
|
60-70
|
Standard
|
Digest
|
7th or 8th grade
|
75
|
70-80
|
Fairly easy
|
Slick-fiction
|
6th grade
|
80
|
80-90
|
Easy
|
Puff-fiction
|
5th grade
|
86
|
90-100
|
Very easy
|
Comics
|
4th grade
|
90
|
表2.2表明TEM4(2009)阅读理解中各篇文章的易读度都在50到80之间,结合表2.3的易读度参考量表可以看出四篇文章中有一篇偏难一篇偏易,两篇适中,平均值也在标准值之间,易读度在50到80之间的操本族语者的成年人占了40%到80%。对于易读度,杨惠中 & Weir[9]认为易读度公式的设计是用于测试持本族语者的而非外国人的阅读能力英语专业四级考试,但是可以作为外语测试者命题的统一参考标准。因此,通过上面对易读度的分析,TEM4 (2009)阅读理解中大部分文章难度适中,基本符合《大纲》要求。
2.1.3 语篇类型
对于选材原则,《大纲》明确规定:“题材广泛, 包括社会、科技、文化、经济、日常知识、人物传记等;体裁多样, 包括记叙文、描写文、说明文、议论文、广告、说明书、图表等。”在Alderson[11]看来,“好的阅读测试应该能够通过考察受试者不同的题材来评估他们的理解能力”。Weir[12]67也指出“理想状态下应该从合适的体裁中选择具体的话题,同时对于这些题材的选择不能存在文化偏见”。对于TEM4 (2009)阅读理解题材与体裁分析如下:
表 2.4 TEM4(2009)阅读理解题材与体裁
|
Text A
|
Text B
|
Text C
|
Text D
|
题材
|
社会文化
|
科技
|
日常生活
|
日常生活
|
体裁
|
说明文
|
说明文
|
记叙文
|
记叙文
|
从上面可以看出大部分文章的题材属于社会文化范畴,包括社会生活、日常生活等,而体裁也主要集中在说明文和记叙文两类。因此,这样的分布也是符合大纲的要求的,但是题材和体裁的覆盖范围过窄,像经济、人物传记等题材没有涉及,同时体裁方面也没有议论文、描写文等。因此,在以后的测试中题材及体裁应该呈现多样性,这样才更有利于英语的教与学。
2.2 预期回答特性
预期回答是由指示、任务以及所提供的输入共同作用下的而产生的语言使用或作出反应的测试。预期回答特性主要从回答类型(response types)和阅读技能两方面进行分析。
2.2.1 回答类型
回答类型主要包括选择性回答(selected response)、有限生成回答(limitedproduction response)以及扩展性生成回答(extended production response)。多项选择题(multiple-choice questions,MCQ)形式作为一种选择性回答类型英语专业四级考试,广泛用于各类考试中的阅读部分,如CET4, CET6, TEM4等。《大纲》也规定了TEM4阅读采用的是多项选择题形式。由于答案的客观性,多项选择题可以通过机器阅卷,从而确保了评分的快速、客观、准确。此外,一系列的统计工具可以用于项目分析(item analysis)、测试分析、分数等值(score equating)、特定项目题库(item banking of selected response items)等;这一类型的测试可以很容易的进行预备测试[13]。然而在测试受试者阅读能力时,多项选择题也具有一定的缺陷中国论文网。正如Weir[13]44所说,“回答多项选择题本身就是一项不切实际的任务,因为在现实生活中不会给出几个选择项去从中作出选择”。此外,多项选择题的形式可以通过猜测来答题,受试者单纯地评猜测也有25%的正确率。
对TEM4 (2009)阅读理解的仔细研究表明所有的题目都是采用的多项选择题的形式。出于对阅读理解效度方面的考虑,本文建议测试者在命制此类测试时应更加细心。
2.2.2 阅读技能
Alderson[11]指出阅读理解需要合理的调配阅读技能、能力和策略。《大纲》规定了如下六项阅读技能:
1/2 1 2 下一页 尾页 |