400-123-4567
在第十五届中学生骨干英语教师新课程教学高级研修班的现场,程晓堂教授 就“英语学业质量标准及考试与评价建议解读”做了一场专题报告,给我们带来一场精神的洗礼。下面我们来欣赏这场思想盛宴。
专家简介
程晓堂
国家英语课程标准研制组核心成员、中国教育技术协会中小学外语教育信息化应用工作委员会名誉主任、北京师范大学外国语言文学学院教授。
报告正文文字整理
英语学业质量标准及考试与评价建议解读
▲▲▲
第一部分:英语学业质量标准解读
课标第五大部分就是学业质量,一共有三个小部分:第一学业质量的内涵,第二学业质量水平,第三学业质量标准。看课标最好去看纸质版的课标,教育部发布的电子版和正式印刷纸质版是有区别的,网上下载的电子版课标不是最终版。
一. 为什么要研制学业质量标准?
课程标准是从西方传过来的基于课程标准的课程改革。西方的课程标准一般分两个部分:学业内容标准、学业质量标准。即课程标准应该包括两个方面:第一内容标准,第二质量标准。内容标准, ,是指学生在一定年级和学段应该学习哪些内容?形成哪些认知能力?
质量标准也叫学业成就标准,是指学生在内容标准规定的学习领域应达到的程度。内容标准规定学生该学什么?学到什么程度?而质量标准规定学生应该达到什么水平?即内容标准规定学什么?而质量标准规定学了以后形成怎样的能力?达到什么样的要求?2001、2003 和 2012 版的课标都叫内容标准,其实是把内容和质量合在一起。课标从第一个版本到现在不断的变化、改进,也是与时俱进和进步的过程。
上图中是美国 21 世纪外语课程标准, for in the 21th 。美国著名的 5C ,是从 1999 年起草课标一直参考的美国外语课程标准。从 2001 年到 2011 年颁布的各个课程标准,主要以内容为主,质量要求有所提及,但没有单独设置学业质量标准。课程标准重点在于设计学习内容和学生学习经历;学业质量标准重点在于学习结果和评价标准。不仅要明确学生学什么,也要建议学生怎么学,更关键的是对学习结果的评价定出标准,作为考试的依据。
二. 什么是学业质量标准?
首先学业质量是学生在完成学科课程学习之后的学业成就表现,学业质量就是学习的结果,学习结果有高有低、有好有差,就像任何一个产品的质量都有高有低。而质量标准就是以本学科核心素养及其表现水平为主要维度,结合课程内容,对学生应取得的学业成就表现的总体刻画。即质量有高有低,但质量标准是明确规定的,一个学生应该达到的最低的质量要求就叫标准。
三. 学业质量标准的作用?
这既是指导学生开展课堂教学的依据,也是阶段性评价学业水平考试以及高考命题的重要依据。高中课标明确指出,高考命题的主要依据是学业质量标准。学业质量标准就是关于学生通过课程学习达到什么学业水平的规定。
高中英语学业质量、语言能力、文化意识、思维品质和学习能力等方面的核心素养为基础,结合高中英语课程内容以及高中生英语学习进阶情况,重点描述高中学生在特定问题情境中,运用英语解决问题的能力表现。即高中英语课程的目标是让学生形成在特定问题情景中用英语解决问题的能力。给出一个问题情境和一些素材让学生去解决,将来的考试可能就是这样。比如:
有人说单选题是问题情境,但这不是解决现实问题的情景。还有大多数阅读理解题中 ABCD 选择题也不是问题情境。还有这样的写作题:假如你是李华,你们班上搞了一个郊游,请你写信告诉你的美国朋友 Tom,也不是问题情境。
将来高考很可能采取问题情景的考试题。问题情景是设置一个情景,给一些素材,提出问题,然后去解决。
比如现在英国的很多考试,包括 PISA 考试就是这样设计的,其阅读考试题非常值得研究。我特意下载一本 PISA 考试模拟题 300 多页,里面很多都是一些问题。
高中英语学业质量考虑到高中课程的结构:有必修课、选修课,有毕业要求、高考要求,还有特殊需求的学习要求……因此分为三个水平,对应三类课程和三类要求,比如说毕业要求、高考要求以及部分学校的要求。
这是关键问题,也是将来考试命题划分试题难度的重要依据。
问题情境本身的复杂程度
问题情景本身的复杂程度是指:所要解决问题是不是复杂?比如:我现在想坐着讲课,让李静老师给我拿个椅子。这个问题不复杂,她搬个椅子就完了。如果我觉得这屋里太冷,要把空调关掉,也很简单。但是如果我让李静老师帮我解决一下屏幕故障,估计她解决不了,因为这个问题比较复杂。
问题对相关知识技能和思维品质的要求
复杂程度不一样,情景对知识能力要求不一样。将来的考试设计题或教学设计,可以从这几个方面考虑。
问题情境设计的情感态度价值观
平时我们帮人做点小事情没什么问题,但如果要上前线去打仗,就需要考虑考虑,不一定马上说:“yes,I will go。”这涉及到对这个问题本身的情感态度价值观。再比如:我今天出门忘带钱了,要买一瓶水。我说:“新忠借我五块钱。”他肯定说“没问题。”但是我哪天打电话说:“新忠,我最近要买房子还差 200 万,你借我 200 万行不行?”他肯定说:“抱歉,我没有。”其实他有也不可能错,不是说他自私,也不是说我们俩关系不好。是因为不管在中国还是在国外,人与人之间帮小忙可以,帮大忙就要考虑考虑了。
这就涉及到个人情感态度价值观,彼此之间的信任程度、对对方的了解等等。问题情景在情感价值观涉及很多。注意“问题情景”这四个字连在一起就是在某个情景下发生了某个问题。
解决情景问题的能力就是考察学生的表现能不能有效合理的解决问题。这是培养学生综合能力非常重要的一个方面。中国学生擅长考试、得高分,但解决问题的能力很差。在真正需要解决问题的时候,才发现知识能力的缺陷。
学业质量与三个水平课程的关系
水平一,针对必修课程;水平二,针对选修性必修课程;水平三,针对选修课程中的提高类课程。
这些术语中:必修课是所有高中生高中毕业必须修的;选择性必修课指选择参加高考的学生要学的课,选择参加高考就是必修课,选择不参加高考就是选修课。比如有学生高中毕业要出国到国外申请大学,不参加高考就不需要修这些课程。
四. 学业质量标准与课程目标的关系?
学业质量标准与课程目标相互呼应,但二者并不完全等同。课程目标是指课程在促进学生素养发展方面的预期目标,比如:学这个课预期达到什么目标?
学业质量标准是检验该课程目标是否达成以及达成程度的检验指标。目标是指做事情最终的目的,能不能完成?质量标准是检验是否完成以及完成的程度。比如:
到驾校学习开车,目标是学会开车。但如何判断一个人是否会开车?需要一些检验指标。比如科目三的考试里面涉及到起步、变道、通过路口、会车、超车、调头、靠边停车等技能的掌握和运用情况。这些能够做到,就会开车了,但这些也仅仅是一些关键的指标,并不一定是全部。即做到这些,只能证明合格,还有科目四考察驾驶员道德。
五. 学业质量标准与课程内容的关系?
有些学科学习内容、学习目标、学习质量既是紧密关联的,又是重叠的。如某个学科的某个知识模块既是学习内容也是学习目标,它的目标就是掌握知识同时也能运用知识,也算质量标准。
但是英语学科不一样,学习内容不是为了掌握这些内容本身,而是通过这些内容的学习形成某种能力和素养。那么学习质量标准也不针对这些内容的学习和掌握情况而设置。
比如:英语学科的课程内容有六大要素:主题、语境、语篇类型、语言知识、文化知识、语言技能和学习策略。但就英语学科而言,学生学这些课程内容不是为了掌握这些内容本身,而是为了发展英语学科核心素养。
把教材本身的材料掌握到什么程度不是最关键的,关键是通过教学内容的学习形成什么样的核心素养。教材太难了,可以降低教学要求,内容太多了,可以减少教学内容……目标是根据课标要求学生,而不要太在意教材本身。比如:
一个人去吃饭,点了十道菜吃不完,不会硬撑全吃下去,而是打包回家。一桌菜有辣、有甜,有酸、有苦,吃愿意吃的,吃适合的。教材内容也是这样的。
再比如,在英语课程实施过程中,英语学科的很多学习内容是一篇篇的英语语篇,但是学业质量标准并不规定学生要学多少语篇?学习哪些具体语篇?要学到什么程度?英语教材有很多版本,每个版本课文都不一样,说明学什么语篇并不关键,关键是学完以后能不能形成素养。语篇重要在选择语篇本身的质量:语言是不是优美?是不是具有很好的内容?主题意义是不是值得我们来探究?至于是哪个主题?谁的故事?其实没有太大关系。比如刚才讲的加拿大,其实中国、美国、南非、毛里求斯都可以。总之,课标并不规定高中教材要选什么语篇,也不规定语篇本身学到什么程度。
六. 学业质量标准研制中的问题?
如何处理质量标准与课程内容和目标的关系?
现在有课程内容、课程目标、学业质量标准、考试建议,老师上课不知道根据哪个来决定。其实都要考虑,因为这些部分之间是协调的。如何使三者既呼应协调又不重复?如何使三者对教学评价发挥不同的作用?将来的教学是以课程内容为依据来设计?还是以学业质量标准为依据?还是以考试命题建议为依据?这是需要思考的。
如何确定质量标准?
质量标准是抽样的还是全面覆盖的?如果是抽样的,如何抽取关键指标?如果你们仔细看课标会注意到,课标在课程内容部分有几十页非常多的内容,课程目标也不少,但学业质量标准总共只有两页。不能只看学业质量标准,针对这个去教学,因为学业质量标准是抽样的,抽样的标准都是特别关键的,但抽样的每一个学业质量标准背后还有更多的知识和技能,所以不能只根据质量标准一条一条去教学。
如何确定学业质量标准的精细程度?
有几个不同版本的学业质量标准,这是曾经一个版本,是必修课中的理解能力的七条学业质量标准。
横看 ABCDE 是第一条质量标准的五个不同的要求:A是能抓住熟悉话题与拼的要点和意图,分析和综合其中的信息和观点;B是能判断和识别意图,获取主要信息;C是能抓住日常生活; D是能从日常生活语篇中获得大部分信息;E是能从日常生活语篇中获得部分信息。
每一条标准有五个等级。如果在命题的时候选第一条作为标准,学生达到 A就说明优秀,E是不合格,D或者 C是合格。这样有利于考试以后评判学生优秀、良好、合格、不合格。这是借鉴澳大利亚课标的,包括必修课的理解能力和表达能力、选修课的理解能力和表达能力、选择性必修的理解和表达、选修课的理解和表达,总共有 210 格,还有多……综合组讨论都说太详细了,应该用一段文字来描述一个情境,学生做事情有什么表现……对学生解决问题的能力表现用连续一段话作描述。所以就改成下图中这样:
图中蓝色指情景以及主题等等,红色是核心素养的四个方面,这个版本还需要具体、有条目式,所以就在后面加了一栏数字表示四类素养的要求。
进一步研究出最后的版本:第一个数字表示水平,第二个数字表示每一水平的每个标准的序号,所以每个水平三有 14 条,总共 42 条。这样做简单一些,但实际上有一个潜在问题:家长如果拿这些质量标准去考学生怎么判断?因为学生的实际水平有不合格、合格、良好、优秀。
2003 年教育部做中考改革,又在五级的基础上划出 ABCDE 五个等级,又在此基础上修改为最后下图中这样:
第二部分:学业水平考试与高考命题建议解读
第二部分是课标的第五部分,即教学实施建议中的第三小节:学业水平考试命题建议。过去课标的评价建议包括平时和考试的评价,这次把它们分开写。这一部分有几个关键部分。
一. 核心素养测试与考试的总体要求
课标中要求:核心素养的测评应该在测评语言运用能力的同时,渗透对文化意识思维品质和学习能力的评价测评。素养可测可评,但并不等于能通过考试来测评。考试与评价强调核心素养主要是测那些能通过考试来测的,一定要渗透对文化意识思维品质和学习能力的测评。对语音、词汇、语法、语用、语篇和文化知识的测评,渗透在语言理解能力和表达能力的考查之中。即课标除了语音、词汇、语法以外,还提出了语用知识、语篇知识和文化知识。
将来考试不直接考察这些知识,而是把它放在理解能力和表达能力的考查之中,即在听说读写的考试之中。所以将来的考试不会单独再考孤立的语言知识。而是在理解和表达中渗透对知识的考察,其次就是学业水平考试和高考是测评的核心,通过这两种考试影响其他的测评。
二. 考试命题遵守的基本理念
考试命题遵守的基本理念非常重要,复习备考不能针对哪个考试题型。比方说七选五的教学就是一个错误的备考方向。七选五反映的是阅读能力,其本身的培养不是通过做七选五的题,而是用其他方式。
第一,根据普通高中英语课程目标和理念确定命题的导向和原则。即命题要有正确的导向,这个导向就是引导老师和学生去实现课程标准规定的目标、去践行课程标准、倡导的教学理念。
第二要全面考查英语学科核心素养。
第三,要根据英语语言的实际使用情况命题。即考试题最好用生活中人们的语言方式来考,比如:
考口语能力最好就是面对面的口语交流,考阅读能力就是读科技文献、读广告、读报告,然后完成某个任务。而不是现在很多老师让学生读一篇文章选 ABCD,这不是生活中人们使用语言的情况。做听力部分也是听了以后再选答案,但选择题、填空题、包括匹配题都不是现实生活中人们使用语言的方式方法,所以理论上这些形式都是不理想的。最近有一个基于问题情景的语言考试形式,让学生和小组成员合作解决一个问题。美国出现了基于互联网络的考试。考试还是学生自己考,但是在网上有几个虚拟的角色在网上互动,这样就形成一个小组解决问题的考试情景。我的一个博士生想在中国做这样的考试,后来他说不太现实,因为这个考试虽然一个人考,但要在网上有虚拟的合作伙伴,还要去网上查资料、讨论、交流,考试命题难度是很大的,考试实施难度更大。
第四是充分考虑学生生活经验和认知水平。
第五是确保实体信度效度。
第六是制定合理的评分标准。
下面我再重点给大家介绍几种考试题型:
例一
上图是课标中一篇阅读考试题,关于东亚人和欧洲人在识别面部表情方面的差异。其中第三道是 Do you have any doubt about the data or ideas in this ? Give at least three ?这篇文章是关于东西方人们识别面部表现差异,首先是文化差异主题。文化意识是我们课标核心素养的一部分,从选材就能够考查学生的文化意识。这道题明显是让学生理解东西方人。
第三道题:对文章中的数据和想法有没有怀疑?这是考思辨能力和思维品质。这是开放题,开放题因为不好判卷不太敢用,但是国际上大型的考试越来越多采用开放题。举这个案例是让大家以后再读这种课题时要注意:第一考哪个素养?第二用什么形式?考试形式用到选择题和开放题,素养是文化意识和思维,以及语言。
例二
上图的写作题和刚才“假如你是李华”那个写作题不一样。首先“假如你是李华”这种事情没发生,第二要写的事情也不存在,不便于展示学生真实的写作能力。而原谅是美德,是写生活中发生的故事,不是编造的事,用生活中的 story 来说明原谅他人很重要。
例三
上图这道题体现了“以生活中语言使用情况的形式来命题”这个思想。生活中我们经常听演讲,一边听演讲一边记录信息。这个题有几个特点:第一挖的空都在表格的右侧,这样设空是有利于学生理解的。第二所有这些年代都连在一起。第三要填的大多数都是名词,偶尔会有动词。
例四
上图中的判断题和以往的判断题有一点区别:过去的判断都是选项 A: True,选项 B:False,而这里加个选项 C:Not 。课标在阅读和听力部分的判断题都用了这种题型。
我们在高中做过试测,学生说这道题不好做,他们能判断是不是 True,也能判断是不是 False,但不能判断是不是 Not 。如果真是这样,学生就没有听懂。这种考试形式能更准确地反映学生的理解。
例五
上图是我初中的一个案例,形式特别简单。Where is the women going for this year?我曾经让一个中学生做了这套题,我问他:“你做这套题有什么感觉?”他说:“有点难,但是试一试也适应。”我说:“和你们平时做题有什么不一样吗?”他说:“我们平时做的题好傻。”我说:“怎么叫好傻?”他说:“我们平时的题,录音里面往往只提到三个选项中的一个,有时候提到两个。我只要听到那个 ,就 OK 了。因为录音里根本不提 ,不提 Italy,所以特别容易答对,这道题不一样。”我说:“怎么不一样?”“录音里面三个都提到了。”
这个录音确实提到 ,,Italy,尤其最后一句话,I've a hotel in . My to go to Italy again, so I hope she doesn't mind。不是有意给中学生挖陷阱,这是英国的考试题,是生活中真实的情形。
例六
上图是一篇题目叫 for 的文章,下面是针对这篇文章设计的阅读考试题,Give two words from Para.1 which show that too much 。这篇文章讲:太多的选择反而给人们带来很多困惑和麻烦,是英国一个中学的考试题,不仅要知道文章说了什么,还要知道文章有意选择了什么样的词汇来反映作者的情感态度、价值观、以及隐含的含义。所以作者特意用了 这样的负面词。这是英文表达中一个特别重要的特点,一篇文章多次出现负面词,反映作者对某个事物的态度。