问:
全国大学英语四、六级考试委员会办公室在哪呢?
答:考试委员会办公室是全国大学英语四、六级考试委员会的常设机构,在考试委员会的领导下完成考务组织、考试材料的制作与分发、成绩统计和分析以及其他有关的工作。考试委员会办公室设主任一名,副主任一名。
通讯地址:上海邮政信箱 30-14
上海交通大学浩然高科技大厦 2203 室 邮政编码: 200030
电 话: (021)62812756 传 真: (021)62826622
问:怎样联系到全国大学英语四、六级考试中心?
答: 考生的准考证号以数字1开头的,请到考试中心(1)咨询
考生的准考证号以数字2开头的,请到考试中心(2)咨询
考生的准考证号以数字3、4开头的,请到考试中心(3)咨询
考试中心( 1 )
通讯地址: 北京市清华大学 外语系转
大学英语考试中心(1)
邮政编码: 100084
电 话: (010)62785578
传 真: (010)62771651
分 管:
北京、天津、河北、山西、内蒙古、辽宁、吉林、黑龙江。
考试中心( 2 )
通讯地址: 上海市上海交通大学 外国语学院转
大学英语考试中心(2)
邮政编码: 200030
电 话: (021)62812759
传 真: (021)62822634
分 管:
上海、江苏、浙江、安徽、福建、江西、山东、广东、海南。
考试中心( 3 )
通讯地址: 湖北武汉市武汉大学 外语学院转
大学英语考试中心(3)
邮政编码: 430072
电 话: (027)87886790 传 真: (027)87886790
分 管:
河南、湖北、湖南、广西、四川、贵州、云南、陕西、甘肃、青海、宁夏、
新疆、重庆。
问:何为大学英语口语考试?
答:为了进一步推动我国大学英语教学,适应国家改革开放的需要,使学生更加重视英语口语学习,获得较强的交际能力,经教育部高等教育司批准,全国大学英语四、六级考试委员会将开始实施口语考试(CET-
Spoken English Test),1999 年 5
月起将首先在部分重点院校试行。报考对象暂定为大学英语四、六级考试成绩达到
80
分的在校本科生及在校研究生,符合报考条件者自愿参加。考试每年举行两次。
考试成绩合格者发给证书。
证书分为三个等级,A
等表示能用英语就熟悉的题材进行口语交际,基本上没有困难;B
等表示能用英语就熟悉的题材进行口语交际,有些困难,但不影响理解;C
等表示具有初步的英语口语交际能力。
问:何为高级英语阅读能力测试?
答:根据全国大学英语教学大纲规定,在基础阶段的英语教学完成以后,大学英语必须继续进行更高一级的专业英语阅读教学。这一课程也被大纲列为全国大学生的必修课,是继基础阶段完成以后的必要阶段。是保证实现教学目标的重要环节。
但是自 1985
年以来,专业英语阅读教学并未受到足够的重视。专业英语阅读的教学与测试的实践仍处于比较“自由化”的状态。不同院校对此课程的认识不同,重视程度不同,采用的教材不同,测试方法也不同。这样,教学大纲中规定的培养“以英语为工具通过阅读获取专业所需信息的能力”这一根本的教学目的就有可能落空。
专业英语阅读课程没有受到足够重视的原因是多方面的,如缺乏合适的教材,英语教师缺乏专业知识,专业教师缺乏英语能力等等。其中一个重要原因是没有适当的检查手段。
对于专业英语阅读能力的培养,大多数高等院校还是认识其必要性的,因为这一能力对大学生今后在专业上的提高和发展至关重要。为此,早在
1988 年教育部高教司外语处就提出要“正确理解全面贯彻执行教学大纲”。
近年来,在高教司外语处的领导下,全国高校已开始重视专业阅读课程的教学。随着专业英语阅读教学的不断正规化,客观上要求在我国部分重点高校范围内为专业英语阅读教学提供一种测试手段。
因此,高级英语阅读能力测试(AERT)项目的长远目标是通过设计一个有理论基础的、高效度、高信度的高级英语阅读考试来推动全国的大学专业英语阅读的教学,以期最终真正、彻底地实现大学英语教学大纲所规定的目标,使我国大学生真正具备“以英语为工具获取专业所需的信息的能力”,更好地为我国的现代化建设服务。
在基础阶段,英语阅读教学与测试(如 CET 的
reading comprehension test)仍以提高学生的英语语言能力为目标,而在高级英语阅读阶段,教学与测试的重点应转向阅读的各种技能和策略的培养。
因此,AERT项目的近期目标是:
(1)设计一个高效度、高信度的高级英语阅读考试,使之能最大限度地体现专业英语阅读阶段的教学目标。
(2)不断完善 AERT
考试,使之能最有效的测量大学生专业英语阅读的能力。
(3)通过AERT
考试的反拨作用来推动大学三、四年级的专业英语阅读教学。
目前 AERT
研究已经完成,已经建立了一套完整的、有理论依据的、有数据支持的、高效度、高信度的检查专业英语阅读教学效果的、衡量学生专业英语阅读能力的考试体系,包括考试的实施细则,命题及选材的要求和原则、阅卷标准,分数调整,数据分析,成绩报道等诸多的标准化考试必备的因素。
在此基础上,已经完成了 AERT 范型卷的设计和命题。
为了对范型卷的各项指标进行检测,在上海和山东进行了两次大规模的试测。研究证实了对中国大学生专业英语阅读的理论模式的假设,肯定了阅读能力的可分解性,即除了一个最主要的一般阅读能力因素外,还存在着快速阅读与仔细阅读这两种不同的阅读方式的因素以及在篇章水平上的阅读与在词汇水平上的阅读这两种不同层次上的阅读的因素。
随着对专业英语阅读教学与测试的不断重视,随着这方面的理论研究的不断深入和实践经验的不断积累,专业英语阅读的教学与测试将会与基础阶段的分级教学和测试一样逐步走上正规化的道路。专业英语阅读将会真正成为大学生的一门必修课,中国的大学毕业生将会真正具备“以英语为工具通过阅读获取专业所需的信息”的能力。
AERT“高级英语阅读能力测试”将以一定方式提供给各校使用。
问:大学英语考试的设计原则?
答:一、大规模标准化考试
大学英语四、六级考试以《大学英语教学大纲》为基础。八十年代初随着我国政府实行对外开放政策,人们认识到英语作为国际交际工具的重要性,英语教学受到了各级各类学校的高度重视。为了适应新的形势,1982
年国家教委成立了教学大纲修订组。修订组经过两年的社会需要调查、中学生英语水平调查,确定了大学英语教学目标,又在应用语言学理论指导下,通过调查研究确定了词汇表、结构表、功能意念表、和微技能表,具体地规定了大学英语课程的教学内容,《大学英语教学大纲》还把整个大学英语课程分为六级,每级都有定量指标加以规定。其中一至四级为必修课,五至六级为选修课。《大学英语教学大纲》于1985
年由国家教委颁布,是全国高等学校都要执行的重要教学文件。
国家教委在批准实施《大学英语教学大纲》的通知中指出:“《大纲》确定的教学目的和要求反映了当前国家对高等专业人才外语方面的要求,是我委今后检查大学英语教学质量的依据”,“重点院校应达到的级别由各校自定”,“凡执行本大纲的学校,国家教委将……对结束四、六级学习的学生进行统一的标准考试”。这里所说的标准考试就是“大学英语四、六级标准化考试”。
二、以教学大纲为依据
<<大学英语教学大纲 designtimesp=32191>>规定,语言测试要“着眼在考核学生的语言能力和交际能力,准确性和流利程度。”教学大纲指出:大学英语教学的目的是培养学生具有较强的阅读能力,一定的听的能力和译的能力,以及初步的写和说的能力,使学生能以英语为工具,获取专业所需要的信息,并为进一步提高英语水平打下较好的基础。为此,大学英语考试主要考核学生运用语言的能力,同时也考核学生对语法结构和词语用法的掌握程度。
三、质量要求
<<大学英语教学大纲 designtimesp=32194>>又规定:“语言测试是检查学生语言水平的重要手段,要做到科学、客观、统一和标准化”。为此,大学英语考试在设计时力求做到大规模标准化考试对质量的要求,做到:
1) 评分具有客观性、一致性
2) 对教学具有正确的指导性
3) 分数具有可比性
4)
施考条件对所有考生以及不同考次的考生一律平等
5) 便于施考
问:大学英语考试的总体设计流程?
答:大学英语考试的总体设计流程及运作流程如下。
大学英语考试的质量控制
标准化考试
大学英语考试是一种标准化考试。标准化考试是指采用教育测量技术对学生的英语能力进行测量并符合严格规范要求的大规模考试。
标准化语言测试的目的是提供一种公认的客观标准,通过对学生语言运用的抽样检查来确定学生的实际语言能力。标准化考试通常指跨地区甚至跨国界的大规模考试,往往涉及数十万甚至上百万考生,因此对标准化考试有一系列规范要求,包括内容和形式的标准化、质量的标准化、以及过程的标准化。
1) 内容和形式的标准化
对于标准化考试来说,每次考试的试卷不同,但所考核的内容(语言知识和能力)总体保持不变,试卷形式相对稳定。不同的语言观和考试的不同用途决定考试的内容。
有些考试以考核语言水平(language proficiency)为理论基础,如美国的
TOEFL 考试;有些考试以语言交际需要为基础,如英国的
IELTS 考试;有些则以某一教学大纲为基础,如我国的“大学英语四、六级考试”。不同的语言观又决定不同的考试形式。有的认为语言能力是可以分解的,大量采用孤立的离散题(discrete-point
items),以便扩大对语言点的采样,增加覆盖面;有的认为语言是一种综合能力,应大量采用综合能力题(integrative
skills items),以便测量学生运用语言进行交际的能力。标准化考试通常不以某一教材为依据。对于英语标准化考试来说应妥善处理知识与能力的关系、领会能力与表达能力的关系、流利与准确的关系、句子水平与语篇水平的关系等。
2) 质量的标准化
(1)
标准化考试的信度与效度:信度和效度是标准化考试最重要的质量指标。信度指的是测量的误差要小、可靠程度要高。大规模标准化考试在公开实施前其内部信度应经过检验,一般应大于
0.85。效度指某一项考试是否考了应该考核的内容。效度只能通过外部的、独立的标准进行评价,例如把学生成绩与教师的评价进行比较、把一项考试与某一公认的大规模标准化考试作相关分析、通过长期观察考生语言能力的变化来验证考试的效度等等。一项考试的效度愈高,对分数的解释愈准确。现代语言测试研究的重点是提高测试的效度;
(2)
评分的客观性和一致性:根据评分是否受阅卷员主观判断的影响试题可分为客观性试题和主观性试题。客观性试题的常见形式有多项选择题、简答题、MC-完型填空等。客观性试题的答案是唯一的,因此可用机器阅卷。大规模标准化考试通常采用较多的客观性试题,以保证评分的客观性。主观性试题的常见形式有命题作文、翻译、回答问题等。主观题的阅卷需要采用一系列质量控制措施,包括用计算机进行调整,保证阅卷员本人、阅卷员之间、以及阅卷点之间评分的一致性。也有一些题型如简答题、综合填空等,设计试题时事先规定一定数量的可接受答案,可以称为半客观题,目的是使其尽可能兼具客观题和主观题的优点;
(3)
试题设计的质量控制:为了保证质量,试题设计一般要经过“命题--初审--预测--试题项目分析--审题--构卷--施考--阅卷及统计分析--建立题库”等环节。其中命题应有命题要求,命题员要经过专门训练,考核内容要有一定的覆盖率;进行试题项目分析和建立题库要有一定的数学模型,如经典测试理论的真分数模型、试题响应理论模型等,使每道试题都有客观数据作为参数,保证每一试卷在使用前整卷的平均难易度、试题难易度及区分度的分布情况等都能满足预定的质量要求。对于标准化考试来说一切应经过检验,且有实验数据支持。为了保证质量,标准化考试的试题在考前和考后都是保密的。
3) 过程的标准化
(1)
标准化考试要公布考试大纲。标准化考试作为一种大规模考试,应当让广大考生和用户了解考试内容、试卷构成、试题形式、记分体制等。让考生在答题过程中能充分表现自己的实际能力,使考试能保持评份标准的稳定性,并且使用户能了解分数的含义,正确使用考试结果,为此必须事先公布考试大纲。考试大纲应相对稳定,如果要改变题型,同样应经过充分实验研究,经事先公布后才能实施,以保证考试的稳定性 (2)
标准化考试的分数应具有可比性,因此通常要对不同考次的结果进行等值处理。等值处理可以采用线性等值法、等价百分位法或试题响应理论的分数等值处理方法等,把原始分转换成换算分。只有换算分才能对考生成绩以及教学过程提供大量反馈信息。根据参照系的不同,记分体制分为正态分制、等级分制、百分制等。正态分制要求建立考生成绩常模,用考生在考生总体中的位置来表示考生的成绩,通常用均值和标准差表示。以考生成绩的正态分布作为参照系的考试称为常模参照考试。采用正态分制的考生成绩可与考生总体比较、不同考次可以比较、学校与学校可以比较、不同科目也可以比较,因此考试结果能提供大量反馈信息,成为各级用户决策的依据。正态分是间接解释的分数,而等级分则是把语言能力划分为若干等级,每级所表示的语言能力从词汇、语法、读音、交际功能、流利程度、语言复杂程度等方面进行描述,根据考生的实际能力进行判定,等级分是可以直接解释的分数。这种以某种尺度作为参照系的考试称为尺度参照考试。也可以把两者结合起来,大学英语四、六级考试以教学大纲为依据,又参照一定的常模建立记分体制,同时又考虑到我国采用百分制的习惯,以
72 分作为均值,12 分为一个标准差,60
分为及格,因此大学英语四、六级考试是一种尺度相关常模参照考试;
(3)
标准化考试还应当定期发布成绩公报,常模参照考试要公布建立常模的依据,提供使用手册等
(4)
过程的标准化还包括施考条件的标准化,如考试时间、考场条件、考场指令等都要标准化,使不同的考生具有相同的考试条件。
命题过程的质量控制
考试过程是环绕试卷进行的,在考试过程的诸多环节中起关键作用的是试卷的质量。大规模标准化考试要保持评价标准的稳定性,必须从保证试卷质量着手。试卷的设计要解决考什么和怎么考的问题,同时要保持评分的一致性。前者涉及考试的效度,后者涉及考试的信度。
下面分别从命题过程、记分体制、作文分调整及考务管理等方面说明大学英语四、六级考试的质量控制措施。
命题流程
大规模标准化考试由于规模大,不得不大量采用多项选择题,以便实现机器阅卷并保证评分的客观性和一致性。实验研究证明多项选择题不但可以考核记忆,也可考核判断、分析、推理,甚至可以考核应用。多项选择题虽然形式简单,阅卷方便,但是其命题却是一项专业性极强的工作。
为了保证多项选择题的质量,不但要有一支经过专业训练的命题员队伍,而且整个命题过程包括许多环节,一般来说,用于大规模标准化考试的多项选择题,其命题流程应包含如下环节:
大规模标准化考试中多项选择题的命题流程
(详见《大学英语四、六级考试效度研究》)
命题要求
大学英语四、六级考试委员会以三个考试中心为基础建立了相当稳定的命题员网络。命题员都经过专门训练,熟悉客观题和主观题的命题原则。命题员送交的客观题在题眼的确定、题干和选择项的设计等方面都要符合多项选择题的基本技术指标。此外,考试委员会还对各部分试题提出了具体的命题要求,从考核什么语言技能到怎么考核有关语言技能,都提出了明确的可以操作的要求,以保证考试的效度。
1) 听力理解部分命题要求
听力理解部分的目的是测试学生获取口头信息的能力,包括理解主旨大意、重要的事实细节、理解隐含的意义、言语的交际功能、理解谈话人的观点态度等。
听力理解部分主要考核语言能力,要避免测验智力、记忆力或背景知识等语言外的能力。
听力理解部分目前分为对话和短篇听力材料两部分,所选材料应当是题材熟悉的对话、讲话、叙述、解说等,语言要口语化,避免采用书面语体太强的材料。所用词语不超出教学大纲词汇表规定的范围。
命题时应考虑能够全面考核教学大纲所规定的各种听力微技能。在构成一张试卷时各种听力微技能都要占一定比例。
2) 阅读理解部分命题要求
阅读理解部分的目的是测试学生通过阅读获取信息的能力。包括掌握所读材料的主旨和大意;了解说明主旨和大意的事实和细节;既理解字面的意思,也能根据所读材料进行一定的判断和推论;既理解个别句子的意义,也理解上下文的逻辑关系,理解文章的深层含义。阅读理解不但要求准确,而且要有一定的速度。
阅读材料的选材原则是:
(1)
题材广泛,可以包括人物传记、社会、文化、日常知识、科普常识等,但是所涉及的背景知识应能为学生所理解;
(2)
体裁多样,可以包括叙述文、说明文、议论文等,应体现学术英语(
English for Academic Purposes )的特点;
(3) 语言难度及词汇量符合教学大纲规定的范围。
阅读理解能力包括三个层次:句子层次、语篇层次、以及推理判断层次,命题时应考虑到各个层次的阅读能力要有一定的比例。
3) 词语用法和语法结构部分命题要求
词语用法部分主要测试学生对词和短语的意义、搭配和用法的掌握程度,语法结构部分则主要测试正确使用语法结构的能力。词语用法和语法结构题在四、六级中各占一定比例,但都不应超出教学大纲规定的范围。
4) 完形填空部分命题要求
完形填空部分的目的是测试学生综合运用语言的能力。
完形填空部分的选材原则与阅读理解部分相同,要求学生在全面理解内容的基础上答题。命题时要考虑到要求填入的词项中虚词和实词各占一定比例,并且要包含若干必须在正确理解全文后才可能答对的题项。
5) 综合改错部分命题要求
综合改错部分的目的是测试学生综合运用语言的能力,不但要求学生能够识别错误而且能够写出正确的语言形式,因此是一种对语言表达能力的测试。
综合改错部分的选材要求是题材熟悉、没有背景知识方面的困难、文章难度略浅于阅读理解材料、文章内容要有一定的逻辑展开。命题时在短文中安排
10
个错误(不含拼写错误或标点错误)要求学生改正。错误分三种类型,一种是需要改正某个词,一种是需要增添某个词,一种是需要删除某个词。需要改正的错误有的是局部性的,有的是全局性的,涉及篇章结构;两者有一定比例,要求考生在全面理解内容的基础上改正错误,使短文的意思完整、语言正确。
6) 短文写作部分命题要求
短文写作部分的目的是考核学生运用英语书面表达思想的能力,要求学生在
30 分钟内写出一篇短文,四级不少于 100
词,六级为不少于 120
词。试卷上可能给出题目、或要求看图作文、或根据所给文章(英语或汉语)写成摘要或大意、或给出关键词或提纲要求写成短文等等。短文写作部分的命题原则是要做到使考生要求明确,使考生能够展开思想,学习好的和学习一般的学生都有内容可写,但要避免构思方面的困难,不含有背景知识方面的困难,以便达到考核书面表达能力的目的。评分时主要考虑作文是否切题、能否正确表达思想、意义是否连贯、文理是否基本通顺并无重大语言错误等。
题库建设
题库建设是一个考试机构的基本建设,为了建设题库,大学英语四、六级考试的试卷在考前考后都严格保密。题库要有一定的数学模型,没有数学模型的试题的集合称为题堆(Item
Pool),目前大学英语四、六级考试的题库建设采用经典测验理论(CTT)数学模型,今后拟逐步过渡到采用试题响应理论(IRT)数学模型,并在此基础上逐步开发大学英语四、六级考试自适应计算机考试系统。
问:大学英语考试的数据处理
答:
大学英语四、六级考试每年考生超过一百万,因此只能依靠机器阅卷。为了保证机器阅卷的精度及正确性,在数据输入阶段还要采取大量质量保证措施。
数据输入阶段结束后即开始数据处理阶段,包括
IRT
等值处理、作文分调整、考生成绩正态化处理三个步骤。大学英语四、六级考试为了进行等值处理,每次考试前一周要组织对比考试,建立
IRT 等值处理模型。
在对客观题进行等值处理后,对作文分进行调整。进行作文分调整的目的是滤除阅卷过程中阅卷员评分的主观误差,保证主观题的阅卷信度。这一步骤完成后输出客观题成绩在
25 分以下而作文成绩在 10
分以上的异常考生清单,这种客观题得分极低而主观题得分相当高的异常情况说明必然在某一环节上发生了差错。这时首先检查考生的答题纸,再查作文成绩,检查是否登分错误、或阅卷员评分错误、或因为考生填错
A、B
卷代号而造成错误等等。在以上步骤都确认正确无误后,输出作文分调整模型。
最后进行各种统计,包括全国的、各省市的、各校的成绩统计。作为数据处理的最后一环还要进行试题分析、完成试卷检验报告 大学英语四、六级考试的数据处理采取如此严格的质量控制措施是为了保证考试的信度,最终也是为了保证考试的效度,因为没有信度就谈不上效度。
等值处理
大规模标准化考试的重要标志之一是分数的可比性。为此,首先必须根据考试的性质和目的确定记分体制,使分数具有可解释性,能够说明分数所反映的考生实际水平,以便于用户使用;此外还必须通过等值处理,使不同考次的分数做到等值,达到可比的目的,并保持稳定的测量标准,也就是保持记分体制的参照系不变。
大学英语四、六级考试等值处理的方法及其质量控制措施见《大学英语四、六级考试效度研究》一书
作文分调整
作文是一种对语言表达能力的考试。学生运用语言的结果,可以直接观察,因此作文是一种直接考试。只要题目出得好,作文对考生语言能力的测量最准确,效度最高。而且作文这种题型最难搞应试培训,也最难搞题海战术。要提高学生的成绩,唯一途径是扎扎实实搞好课堂教学,提高学生实际英语能力。从组织考试的角度来看,采用作文题的困难在于如何保证评分的一致性。
作文题是主观题。所谓主观题只是指在阅卷过程中评分要依靠阅卷员的主观判断的题目。至于命题和答题,当然必然是主观的。这些因素最终都会影响到对作文阅卷的判分。要使作文卷的分数能正确地反映考生的真实能力,如果不考虑考生本身这一因素,则影响最大的主要是命题和阅卷两个因素。
大学英语四、六级考试中安排短文写作这一部分,主要目的是考核学生用英语进行书面表达的能力,也就是说主要是考核语言运用能力,因此大学英语四、六级考试的作文部分不是自由作文,而是有控制的作文,对考生写什么内容有比较明确的要求,用各种明确的方式如提纲、图表、关键词等加以规定;但提纲常用中文给出,以避免考生将提纲中的文字直接抄录进作文。采用有控制的作文也有利于提高评分的一致性。
对作文评分影响最大的是评分过程。同一篇作文,不同的阅卷员可能给出不同的分数。提高作文阅卷的信度就是要保证评分的一致性,包括阅卷员本人的一致性(intra-marker
consistency)、阅卷员之间的一致性(inter-marker consistency)、和阅卷点之间的一致性(inter-centre
consistency),要采取一定的质量控制措施尽量减少和滤除阅卷员评分的主观性对分数客观性的影响。
近年来在大规模标准化考试中采用作文题的重要性已为大家所接受,对作文评分的研究发展也很快。
作文题的评分通常有两种方法:一种是综合法(holistic
approach),一种是分析法(analytic approach)。分析法是把一篇作文分解为若干要点,如内容、结构、文章连贯性(cohesion)、语法、词汇等,不同的要点也可作不同的加权处理,各要点得分的总和即为全篇得分。综合法是凭阅卷员通读一遍的总体印象打分。综合法的优点是能从总体上把握通篇印象,评卷速度比较快。此外,为了提高阅卷的信度也有采用两读的方法,即每篇作文由两名阅卷员分别独立评分,若分数差两档以上,由第三名阅卷员重判。考虑到大学英语四、六级考试规模太大,不可能进行两读,因此,决定采用综合法和一读的评分方法,然后根据考生的客观题得分进行调整,滤除系统误差。大学英语四、六级考试实践和效度研究结果证明,大学英语四、六级考试目前采用的作文分调整方法能保证阅卷信度,详见《大学英语四、六级考试效度研究》一书。 |