找回密码
 注册

QQ登录

只需一步,快速开始

查看: 1635|回复: 1

[新课程区] 核心素养本位的测评情境及其设计

[复制链接]
发表于 2018-11-8 18:01:31 | 显示全部楼层 |阅读模式
本帖最后由 geonet 于 2018-11-8 18:06 编辑

核心素养本位的测评情境及其设计
2017年06月19日 16:26 来源:《教育测量与评价》 作者:张会杰
张会杰:博士,2014年5月起就职于华东师范大学教育学部考试与评价研究院。副教授
内容提要:情境关联,是核心素养本位测评的关键工作和质量基础。近年来,国内外教育测评对情境的独特价值有所认可,基于情境的测评实践也逐渐丰富,并强调通过情境设计整合发展学生的核心素养,但总体而言,情境的设计与开发仍是当前核心素养测评的短板——绝大多数测评迄今尚未涉及情境的系统分类与设计,测评内容及测试指向往往是脱离生活世界的较为抽象的学科知识,剥离应用情境的测评普遍存在。因此,我们应充分认识测评情境的意义和重要性,以情境设计为突破口,对测评立意和指向进行适度重构,重视“情境交互”,不仅要将学科知识与技能及其运用的“触发”条件“镶嵌”在测评情境中,还应尊重并在不同程度上认可体现着被试个体特质的个性化作答,以实现对学生核心素养发展水平的最佳评估。

  关 键 词:核心素养 测评体系 测评情境 设计

  标题注释:本文上海市教育科学研究重大项目“招生考试制度改革研究”(项目编号:D1301)的主要研究成果。

  【中图分类号】G40-058.1 【文献标识码】A 【DOI编码】10.16518/j.cnki.emae.2016.09.003

  在当代教育和课程变革中,“核心素养”被赋予了重要的时代意义,特别是在一些国家或地区,“核心素养”已经或正在成为统领性的发展理念。2014年,伴随《教育部关于全面深化课程改革,落实立德树人根本任务的意见》的颁布,我国学术界对“核心素养”的关注急剧上升。目前,《中国学生发展核心素养》已正式发布,可以预计,在未来较长一段时间,“核心素养”仍将成为我国教育政策和学术话语的关键词。国内外经验表明,测试与评价是教育实践变革进程中无可替代的重要推力和关键抓手。本文尝试围绕情境及其设计这一具体维度,对核心素养本位的测评进行初步探讨。

  一、情境关联:核心素养本位测评的重要基础

  (一)国际知名核心素养框架对情境的关注

  人类活动都是在一定情境中展开的,基础教育阶段更是如此,学生核心素养的形成和发展与生活世界中的具体情境关系密切。根据莱夫(J.Lave)等人的研究,“情境”特指真实行为赖以发生的社会网络和活动系统。目前国际知名的核心素养框架均高度强调情境的重要性。

  1.OECD核心素养框架

  1997年,经济合作与发展组织(OECD)启动了核心素养项目,即“素养的界定与遴选:理论和概念基础”计划(简称“DeSeCo计划”),旨在为即将启动的“国际学生测评项目”(简称PISA)提供理论依据,同时服务于另一项针对成年人的国际测评项目“成人素养与生活技能调查”。

  OECD对“素养”的界定如下:素养(competency)不只是知识与技能,它是在特定情境中(in a particular context),通过运用和调动心理社会资源(包括技能和态度),以满足复杂需要的能力。例如,有效交往的能力是一种素养,它可能涵盖一个人的语言知识、实用性信息技术技能,以及对其交往对象的态度。[1]

  可以看出,OECD在对“素养”进行界定时,认可了知识与技能的基础性地位,但更突出学科的知识、技能与现实世界真实情境之间的关联。

  2.欧盟核心素养框架

  2006年,欧洲议会和欧洲理事会联合批准了《终身学习核心素养:欧洲参考框架》,该框架由此成为欧盟成员国教育改革的纲领性文件。

  欧盟对“素养”的界定如下:素养是适用于特定情境的知识、技能和态度的综合;核心素养是所有个体达成自我实现和发展、成为主动的公民、融入社会和成功就业所需要的那些素养。[2]

  欧盟的核心素养是结果取向的,具体指明其应用领域与情境(context),这里的“情境”主要指个人情境、社会情境和职业情境。

  3.美国“21世纪技能框架”

  2002年,在美国联邦教育部的主持下,“21世纪技能合作组织”(简称"P21")成立了,它系统研制适应知识经济和信息时代所需要的“21世纪技能”(通常被视为“核心素养”的别称)。

  "P21"这样界定“21世纪技能”:21世纪的工作,知识根植于情境,且分布于社会之中,而非抽象的、孤立于个体的[3];21世纪素养(literacy)远超出基本的读、写、算技能,它指向如何将知识和技能应用于现代生活情境[4]。

  21世纪技能是知识和技能应用于21世纪生活和工作情境的产物。其框架中开列了包括全球意识、金融、经济、商业和创业素养、公民素养、健康素养、环境素养等21世纪主题(21st century themes),所有这些主题均着眼于培养学生的跨学科意识和运用多学科知识解决复杂问题的能力。“21世纪技能”不仅要求学生建立学科知识和真实生活情境的联系,还要求他们建立不同学科知识彼此间的内在联系,以此帮助学生解决复杂的个人、社会、经济、职业和全球问题。

  综合上述不同核心素养的内涵界定可知,无论是OECD的“运用知识、技能和态度满足特定情境中复杂需要的能力”、欧盟的“适用于特定情境的知识、技能和态度的综合”,还是美国21世纪技能的“指向如何将知识和技能应用于现代生活情境”,这些国际知名的核心素养框架均高度关注特定的生活情境,强调通过情境设计整合发展学生的素养。

  (二)情境关联:核心素养本位测评框架的重要基础

  在与上述国际知名的核心素养框架配套创设的测试评价中,PISA最为著名。自2000年启动以来,PISA在国际范围内迅速产生了广泛和深远的影响力。PISA基于“DeSeCo计划”对核心素养的研究,作为测评的理论基础,是对OECD所推崇的核心素养及其模型的具体阐发与推广。[5]国内学界普遍认为,OECD为界定和选择“核心素养”创造了重要的专业经验[6],代表着国际核心素养研究的最高水平[7]。因此,本文主要围绕PISA测评框架对测评情境及其设计进行介绍和分析。
  由于“想要测的”与实际测验有着复杂的关系,后者如何体现前者需要通过测评框架(assessment framework)进行描述、引导和规定,所以,测评框架应包含测评体系的理念、内容范畴、能力要求以及一些重要的操作步骤所进行的细致阐释和技术说明。当然,作为测评设计与组织实施的蓝图,其命题框架还应指导测评命题过程中的素材选择、加工、设问设计、评分规则制定和试题特性审核等。PISA测评框架的出发点是素养,并将对素养的界定转化为各领域素养测评的操作方案,由各参与国(地区)的专家共同设计。它从四个方面界定各领域素养测评的维度:学生应用所需各学科领域的知识;学生应用所需各学科领域的能力;学生遇到的问题情境;学生对学习的态度和倾向。PISA高度重视情境的设计与开发,不管是阅读、数学,还是科学,测评情境均是测评框架不容忽视的基本要素。如表1所示。
  PISA中的阅读测评根据构建文本的用途,对测评情境进行个人的、教育的、职业的、公共的类别划分和轮廓勾勒。其中,“个人的”是指为了满足个人兴趣而进行的阅读,如小说、传记等;“公共的”是指为了获取公共信息或参加大型社会活动而进行的阅读,如官方文件、公告;“职业的”是指为了完成工作或完成某项任务而进行的阅读,如说明书、时间表;“教育的”则是指为了学习新知识而进行的阅读。
  PISA中的数学测评关注个体能够在不同情境中形成、运用、解释数学的能力,包括数学推理,运用数学概念、程序、事实和工具来描述、解释、预测;尤其关注学生作为问题解决者的身份以及情境和问题之间的有机关联。它在从个人、社会、职业和科学四个角度构造数学问题情境的基础上,更进一步地提出了“数学化地表示情境”,并以此作为三大“数学过程”之首。如表2所示。
  PISA中的科学测评则把涉及科学和技术的生活情境纳入测评框架,并同样视情境为素养发展和测评的基础、前提和载体。如图1所示。
  
图1 PISA 2015科学领域的测评框架[10]
  PISA不仅关注学生个人的情境(包括自我、家庭和同伴群),也关注当地/国家的、全球的情境。各种情境都涉及健康与疾病、自然资源、环境质量、危险、科学与技术前沿五个主题,如表3所示。PISA立足于这些基本主题,广泛选择素材,精心加工,挖掘与开发命题点,最终完成了核心素养本位的测评设计。
  PISA旨在评估学生对未来生活所做的准备,致力于描述出学生在多大程度上能将他们所掌握的知识运用到与生活相关的场景中。我们知道,日常或职业生活中的问题呈现在我们面前时,并不是以学术语言表达的,而且常常伴随着各种各样的干扰信息。因此,为了解决现实问题,我们首先要将其转换为学科问题,进而调用学科的概念、事实、程序和原理对其做出解答,最后代入特定场景对作答结果进行解释、应用和评价。PISA非常重视考查学生在生活情境中分析问题和解决问题的能力。以PISA中的数学测评为例,有研究指出,数学测试大都从情境维度出发测评学生的数学素养,97%的PISA数学素养测试题都是基于真实情境的。[12]可见,情境及其设计在PISA测评中有其独特的价值,是无可争议的标志性环节;情境关联亦是核心素养本位测评的关键工作和质量基础。
  二、当前国内教育测评的“去情境化”及其表现
  自新课程高考实施以来,“新材料、新情境”的命题原则在某些学科已经被写进考试大纲,并成为新课程高考的标志性特点。[13]总体而言,国内对测评情境的独特价值有所认可,甚至视其为命题的重头戏或灵魂。[14][15]具体表现为:对情境的设计与开发越来越关注,基于情境的测评实践也逐渐丰富起来。这些转变应当予以充分肯定,但同时我们也需要认识到,情境的设计与开发仍是我国当前基础教育各学科测评的短板。尽管“考试大纲”或“考试说明”中可能会对测评情境有零星的提及,但迄今尚未涉及情境的系统分类与设计,测评内容及测试指向往往是脱离生活世界的较为抽象的学科知识,剥离应用情境的测评普遍存在。



 (一)剥离应用情境,测评素材完全以学科语言呈现

  传统的测评专注于学科范畴内知识与技能的掌握,直接从学科知识的逻辑体系出发对试题进行设计,相对忽视学科知识与技能的社会意义与应用价值。这一传统模式对纷繁的生活世界漠不关心,主要关注现实世界经高度抽象后的学科本质,并在学科范畴内不断予以抽象化和形式化。“去情境化”测评的出发点和归宿更多地指向学科的内在逻辑或单纯地指向学科知识本身,并未将抽象的知识和生活世界建立关联。这些测评剥离应用情境,题干和设问有时完全以学科语言进行符号化呈现,对特定学科知识和技能调用的落脚点同样囿于抽象的学科概念和原理层面,以至于学生无法将所获得的结果代入现实情境中。而且,通常情况下,已知条件和作答线索都是充分必要的,不多不少。面对高度抽象的、藉由学科概念和术语进行表述的试题,所有熟习学科知识与技能的考生仅依靠学科逻辑、原理及其推理即可作答。然而,就考生作答的意义而言,它更多的是在于学科知识的传承和逻辑思维的训练,缺乏立足生活世界的现实价值。上述类似现象在当下比比皆是,这些可信手拈来的测试无需考生对纷繁的生活世界进行识别与辨析,导致他们在此基础上的感受、体验、联想与关联等思维过程往往被架空。

  然而,抽象的学科知识和具体的生活情境之间,总存在一段或“数学化”或“物理化”的学科化过程,虽然这个过程或长或短,涉及的认知跨度和抽象程度或大或小,但仅着眼于学科知识而剥离应用情境的测评却蕴含着一定的风险,容易导致学生能力发展呈现单一化的趋势。学生习惯于解决学科问题,因此,在面对内嵌社会场景的问题时,他们就会不知如何将其转化为学科问题,出现不着要领、不知所措的现象,加之对情境较为陌生、信息较为冗余的实际情况,考生的识别与辨析常常会受到干扰,以致调用学科思维、方法解决实际问题时存在一定的障碍和困难。剥离应用情境的测评由于只考虑测评的知识指向,没有在应用层面做深层次拓展的自觉努力,使得构成测评重心的学科知识与学生直接的生活经验之间出现断裂。一些学生尽管掌握了学科知识,却不会或不善于调用相关学科的思维和方法去解决生活、职业和社会中的问题,极端状态下,学习者甚至会成为只会解题的应试机器,久而久之,不仅是学生,连部分教师有时也不清楚知识究竟如何源于社会生活实践了。这大概就是“高分低能”现象产生的根源所在。生活世界中问题解决的困难不完全在于学科体系内的逻辑推演,情境也蕴含着知识迁移与运用的“触发”条件,唯有与应用情境紧密结合,学科知识与技能才能被学生深入理解与运用。

  (二)忽视现实意义,作答指向聚焦学科知识与技能

  核心素养的发展过程是学科知识与技能的内化、转化进而外化的过程。学科的知识和技能当然是重要的,是核心素养发展、实现和体现的必要条件,却未必是核心素养的充分条件,因为脱离情境的抽象概念、规则或原理的获得并不必然带来知识与技能的灵活迁移和实践运用。与PISA相比,我们的测评相对忽视对情境主旨的把握,更倾向于对游离于情境之外的孤立的学科知识与技能的考查。以某地2015年中考语文阅读题为例:

  善于倾听

  ①人际交往中,我们最怕也最无奈的就是被人误解,而我们常常也会误解别人。要不怕误解,就要学会交流,要学会交流首先就要学会倾听。

  ②有一位母亲非常生儿子的气,向同事诉苦说:“我实在是不了解他,因为他太不听我的话了!”这句话听上去好像没有什么问题,但仔细一分析,就会发现问题。

  ③这位母亲说“我实在是不了解他”,那“不了解”的原因是什么呢?原因是“他太不听我的话了”。我们想要了解孩子,就要去听孩子说话。认真去听,就会知道孩子在想什么,希望什么,埋怨什么。这位母亲却反过来去做,要了解孩子,却不去听他的,而是要他听她的,她当然不会了解孩子。

  ④所以说,我们要了解别人,善于倾听是最简单的一种方法。

  ⑤有人说,上帝创造人的时候,为什么只有一张嘴却有两个耳朵,那是为了让我们少说多听。

  ⑥善于倾听对我们做什么工作都有帮助。

  ⑦曾有研究人员对同一批受过训练的保险推销员进行研究。因为这批推销员接受了同样的培训,业绩却差异很大。研究人员取其中业绩最好的10%和最差的10%对比,研究他们每次推销时自己开口讲多长时间。研究结果很有意思:业绩最差的那一部分,每次推销说的话累计为30分钟;而业绩最好的10%,每次累计只说12分钟。

  ⑧很显然,说得少,自然听得多。听得多,对顾客的各种情况、疑惑、内心想法自然了解得多,就会采取相应措施,结果业绩自然优秀。

  ⑨善于倾听,还能使你有好人缘。

  ⑩为什么?因为一般人喜欢讲,不善于听。因此,他喜欢讲,你善于听,那当然是一种绝配。

  (11)美国最有影响的人生导师卡耐基,有一次到一个著名植物学家家里做客,整个晚上植物学家都津津有味地给卡耐基讲各种千奇百怪的植物。而卡耐基呢?听得津津有味,目不转睛,像个特别喜欢听故事的孩子,中间只是偶尔忍不住问一两句。没想到,半夜离开时,植物学家紧握着卡耐基的手,兴奋地对卡耐基说:“你是我遇到的最好的谈话专家。”

  (12)卡耐基一个晚上根本就没有说什么话,只是听,却居然获得了“最好的谈话专家”的美誉!(文/周士渊,有删改)

  1.本文第①段是如何引题的?这样写的作用是什么?(2分)

  2.请以第③段为例,简析本文的语言特点。(2分)

  3.第(11段)中两个“津津有味”相同吗?谈谈你的理解。(2分)

  4.说说本文第(11)段所用论据的特点。(2分)

  5.本文的中心论点可以概括为什么?(2分)

  参考答案:

  1.(2分)由人们日常的人际交往引出议论的话题;点明了学会倾听的重要性。

  2.(2分)第③段以自问自答的形式,以通俗的语言,进行说理,使人容易接受;本文语言通俗,层次分明,含有丰富的哲理,说理性强。

  3.(2分)不相同。植物学家的“津津有味”指他对自己专业知识的熟识和热爱(讲得有兴趣,有滋味、趣味等)。卡耐基的“津津有味”指他善于倾听(听得投入)、兴趣浓厚,对对方尊重。

  4.(2分)运用了名人事例做论据,论证了“善于倾听,还能使你有好人缘”;具有较强的说服力。

  5.(2分)善于倾听好处多(意思接近即可)。

在日益多元的社会中,价值观、情感和观念的冲突常常难以避免,负责任地倾听、善于倾听是人际交往中的一种关键能力,也是现代人的一项基本素养。本试题自身的思想内容反映了这些人文性的内涵,但测评指向仅着眼于文段的语言、结构、主题材料、表达方式等,命题点几乎全都聚焦于语文学科概念性或规则性的知识形态,生活世界的倾听素养并未体现,换言之,测评指向离析文本承载的核心内容,剥离了情境主旨,“如何善于倾听”这一素养的内涵并未被充分挖掘,这样的测评使得考生的思维空间比较小,客观上限制了学生对倾听素养的学习和把握。

  语文存在一套知识系统,包括汉字、词汇、语法、修辞、章法等,这属于语文自身的学科知识。以目前典型的阅读测评为例,文段通常选择文体特点明显的材料,测试从文体特点入手命题,说明文大多集中在说明方法、说明顺序、说明语言以及说明对象的特点上;议论文大多集中在论点、论证方法、论据、议论语言上;文学类文本大多从语言(修辞、表现力、理解内涵)、主题、人物(性格、形象)、结构入手。这些测评尚未在语文学科知识、知识的运用以及学生作为家庭成员、公民和未来工作者的生活之间建立关联,命题程式化,答题几乎都有相对固定的模板和套路。考生只需将固定的知识点直接套入“作答模板”中即可以不变应万变,轻松作答。当然,所谓的轻松建立在考前大量和反复记诵的基础之上。笔者曾以该试题在华东师范大学本科生中进行非正式测试,能准确作答者寥寥无几。这些本科生反映,作答时还能依稀记得当时在备考时记诵的答题思路和要点轮廓,但由于较长时间对答题套路的疏离,并不能给出逼近参考答案的完整和清晰的作答。实践表明,要想在这一类测试题上获得满意的分数,突击操练是相当灵验的,知识点或作答套路的熟练识记普遍有效,由此导致应考时大量“刷”题、反复强化练习也就不难理解了。这一现象在一定程度上意味着,上述测评的指向或许就是那些“惰性知识”(是指“人们刻意记忆时能够回忆起来的知识,但这种知识却不能被自发地用来解决问题”,或称为“僵化知识”)。[16]

  上述实例的测评理念和方法普遍存在于国内基础教育诸多学科的测评中,由此折射的问题值得我们深思。理解文本内容本身承载的意义,是阅读活动的根本目的,但试题却只关注构成文本的形式世界,关注阅读学习的过程,关注如何阅读的语法知识和技巧,而不是文本内容的意义世界和文本自身所承载的对人的意义。其实,阅读过程不仅是简单的语言材料的习得掌握过程,还是学习主体情感丰富、思想碰撞深化的过程。[17]学习者在对一篇文段进行阅读的过程中,自然会延伸其思维、拓展其视野、丰富其思想与情感。因此,基于学生核心素养的测评,应将关注点置于学科知识的工具性与其承载内容人文性的内在联系与互动中,把学科的知识和逻辑看作核心素养的辅助和支撑,藉由这一支架性的基础,体现学习的实质性结果——建立起知识与生活经验的联系。

  三、以情境设计为突破,构建核心素养本位测评体系

  (一)充分认识测评情境及其设计的意义和重要性

  加拿大学者西门斯(George Siemens)在阐述联通主义学习理论时指出,真正的学习不仅是获得知识、技能和理解,更重要的还包括行动,也就是发展学生“做事情”的综合能力;学习并不是知识或技能的层级化积累,而是意义化(meaning)的连接建立和网络形成的过程,新的节点不断出现、编码并且与网络中的其他节点发生联系,从而促成学习的实现。[18]从这层意义上讲,真正的、面向核心素养发展的学习也应具有网络的特性;知识的层级化积累未必是素养发展的最佳策略。倘若固守单一的知识观,并以灌输、机械训练为主进行学习,反而可能导致素养的停滞甚至衰减。

  只有当学生在有意义的情境中对已学习过的东西整合地加以调动的时候,他们才算是有能力的。[19]换句话说,也就是一个有“素养”的人,当他或她置身于特定情境的时候,有与特定情境相契合的“恰当性、充分性或态度”。核心素养不是无关情境的抽象存在,而是内在要求学习者能在具体的社会场域或文化脉络中实现对各类信息的恰当理解和使用。测评指向若不具备联通或活化学科知识与技能的意义化内涵,就不能体现核心素养的本质属性。生活世界中具体的情境是学生核心素养发展的重要载体和有益路径,既为知识的掌握与运用提供了活动的背景,也是知识的习得和运用得以发生的活动场景和资源条件。[20]基于情境的测评推动着个体关键能力的发展和优化重组,必将成为评判和发展学生核心素养的重要基础。

  (二)测评范式:从“知识本位”走向“思维认知”

  核心素养本位的测评,需要我们以情境为突破口,对测评立意和指向进行适度重构,从传统的“知识本位”的测评范式走向“思维认知”的测评范式,即由测评学生是否掌握了特定学科的课程内容转向关注学生能运用学到的内容做什么,测评不仅需要关注学生对学科领域知识和技能的掌握,更需要关注学生应用学科领域知识与技能的能力,关注学生在不同情境中提出、解释和解决问题时有效地进行分析、推理和交流的能力。核心素养体系下,学科知识与技能不再仅仅作为一个孤立的子系统存在,而是核心素养体系的一个部件,反映着特定学科教育对学生发展核心素养的独特贡献。学科知识与技能不再是学习的终结目标,而是未来生活和工作所珍视的复杂心智运作的基底,是新情境背景下问题探究与解决时使用的智力资源。正如教育学家布鲁纳所言:知识是过程,而非产品。[21]核心素养本位的测评追求更为广泛的社会生活的整体建构,重视对“思维认知全过程”的考查,体现逻辑链条的完整性,关注由现实问题向学科问题的思维转换。特别应该指出的是,核心素养与学科“双基”是一种包含、融合和超越的关系,核心素养包含并超越了传统的“双基”,在继承“双基”的基础上,核心素养本位的测评需打破传统命题模式的束缚,不再单纯使用纯粹的学术语言考查学科问题,而是要强调真实情境问题的学科化过程。因此,命题者不宜采用从概念到理论的命题模式,应尽量从事实到概念再到理论,最后回归到问题解决上。

  (三)情境及评分设计:从“学科孤立”走向“情境交互”

  情境及评分设计是测评体系的必备环节,也是测评立意和指向调整的突破口。“情境”作为测评体系的内在组成部分,不同于外在的、现实的“环境”,而是一种经过遴选、加工和再造的微环境。核心素养本位测评情境的设计意味着对知识学习的社会意义和应用价值的高度关注,意味着对测评情境内在社会性特质的充分挖掘。对学科知识与技能的测评虽然仍应当保留,但我们不必刻意追求其系统性和全面性,同时应注意摆脱对概念定义机械记忆的孤立考查。情境及其设计应基于中国学生发展核心素养体系,围绕人文底蕴、科学精神、学会学习、健康生活、责任担当、实践创新六大素养选择原始素材,积极挖掘情境的测评价值,将学科知识与技能及其运用的“触发”条件“镶嵌”在测评情境中,使测评指向的任务紧密地结合生活现实,使学生在与问题情境持续的交互作用中进行理解、提炼、分析,并最终探究出问题的应对和解决之道。更进一步的是,“情境交互”的测评理念正视情境、被试个体及其作答反应的相互关系和作用,认为被试的作答反应不仅受测评情境的影响,也在一定程度上受被试的个体特质的影响——这是作答空间开放性和丰富性的基础性前提。这一理念突出体现在开放性试题,尤其是着重考查解释、反思与评价等高阶思维的开放性试题的评分上。开放性试题的评分最能体现试题设计的品质,同时也是容易引发争议的部分。反映“情境交互”理念的评分设计要求考生利用专业知识,但警惕仅仅依循命题者和评分者主观理解的“标准答案”,要尊重并在不同程度上认可体现着被试个体特质的个性化作答。PISA等测评从实践层面证实了“情境交互”的评分设计能实现对被试核心素养发展水平的最佳估计,这方面的设计技术值得我们关注和借鉴。

  2015年以来,我国普通高中课程方案和各科课程标准全面进行新一轮的系统修订,自此,我国基础教育课程改革进入核心素养本位的新的发展阶段。核心素养需要具体的测评技术来保证。测评情境具有独特价值,其设计与开发不仅是测评技术的进步,亦是测评观念及其背后教育观念的进步。具有合理测试情境的试题设计带有合理的经验基础,因此,它比以学科符号、学科术语对试题进行设计开发更为复杂。伴随中国学生发展核心素养体系理论研究和实践探索的逐步推进和深入,我们有理由相信,不同学段、不同学科的测评体系中,测评所依托的素材范围会大大拓展,测评情境亦将大大丰富,不管是对测评情境的理论研究还是操作层面的设计开发,其技术水平都将有望实现较大突破。

 参考文献:
  [1]戴维·H.乔纳森.学习环境的理论基础[M].郑太年,等,译.上海:华东师范大学出版社,2002:55.
  [2]OECD.The Definition and Selection of Selection of Key Competencies[EB/OL].[2016-08-12].http://www.oecd.org/datao ecd/47/61/35070367.pdf.
  [3]Gordon,Jean et al.Key Competences in Europe:Opening Doors for Lifelong Learners Across the School Curriculum and Teacher Education[EB/OL].[2006-12-18].http://www.case-res earch.eu/upload/publikacja_plik/27191519_C-NR_87_final.pdf.
  [4]Partnership for 21st Century Skills.Learning for the 21st Century:A Report and a Mile Guide for 21st Century Skills[EB/OL].[2003-08-07].http://files.eric.ed.gov/fulltext/ED4-80035.pdf.
  [5]屠莉娅.基于变革社会的视角:核心素养阐发与建构的再思考[J].全球教育展望,2016(6).
  [6]崔允漷.追问“核心素养”[J].全球教育展望,2016(5).
  [7]张华.论核心素养的内涵[J].全球教育展望,2016(4).
  [8]OECD.PISA 2015 Assessment and Analytical Framework:Science,Reading,Mathematic and Financial Literacy [EB/OL].[2016-07-27].http://www.oecd.org/edu/pisa-201 ... 9264255425-en.html.
  [9]OECD.PISA 2015 Mathematics Framework[EB/OL].[2016-04-19].http://www.oecd-ilibrary.org/docserver/down-load/9816021ec005.pdf?expires=1470810241&id=id&accname=guest&checksum=3F8BAB3777CDB494C341A38C6-7C08-770.
  [10][11]OECD.PISA 2015 Draft Science Framework [EB/OL].[2016-06-15].http://www.oecd-ilibrary.org/docserver/download/9816021ec003.pdf?expires=1470808-484&id=id&-accname=guest&checksum=12D37853B42E0-75496D4B4-8BE789CF07.
  [12]綦春霞,周慧.基于PISA 2012数学素养测试分析框架的例题分析与思考[J].教育科学研究,2015(10).
  [13]黄牧航.论历史情境命题[J].历史教学,2012(13).
  [14]朱爱君.地理材料情境题——高考命题的重头戏[J].中学地理教学参考,2003(7/8).
  [15]陈进明.物理问题情境设置——高考命题创新的灵魂[J].中学生数理化(教与学),2007(11).
  [16]美国温特贝尔特大学认知与技术小组.美国课程与教学案例透视——贾斯珀系列[M].王文静,等,译.上海:华东师范大学出版社,2002:19.
  [17]郑国民,李倩.加强优秀诗文积累:语文课程价值取向的变革[J].教育研究,2015(11).
  [18]王志军,陈丽.联通主义学习理论及其最新进展[J].开放教育研究,2014(5).
  [19]易克萨维耶·罗日叶.为了整合学业获得:情景的设计和开发[M].汪凌,译.第2版.上海:华东师范大学出版社,2010:5.
  [20]张琼,胡炳仙.知识的情境性与情境化课程设计[J].课程·教材·教法,2016(6).


淘宝网搜索“星韵地理网店”地理教辅、学具、教具专卖。
 楼主| 发表于 2018-11-8 18:09:12 | 显示全部楼层
张会杰:何以谓之“好”:核心素养本位测试题的关键特征原创: 张会杰 [url=]中国考试[/url] https://mp.weixin.qq.com/s/_pCnfIQqOJKCSv96XBDFng
作者:
张会杰,华东师范大学教育学部考试与评价研究院,副教授。

原文刊载于《中国考试》2018年第11期第58—61页。
摘要:如何通过试题将学生发展的核心素养测评出来,进而引领和督促核心素养的有效落实,是我们当下面临的一个重要课题。通过对一道有争议的小学三年级数学题的分析,探讨以核心素养为本位的测试题具有整合性、依托情境以及指向问题解决3个关键特征。标准化测试自身是有限度的,在核心素养本位测评范式下,考生对标准化测试题的作答和各界人士对试题的评析应当遵循“满意原则”。这道试题所引发的广泛争议提醒教育研究者在推进基于核心素养的测评范式转型时积极引导社会舆论的必要性。
关键词:核心素养;核心素养测评;测评情境;任务解决;满意原则

1
一道有争议的小学三年级数学测试题

  2018年初,上海市某区三年级数学期末卷拓展提高部分的一道测试题在朋友圈广为传播,反响强烈。题目如下:
  乐器商店新进了9把小提琴,共花了3600元,售价合理的是( ).
  A. 498元/把     B. 498把/元   
  C. 400把/元     D. 400元/把   
  本题正确答案为A项,大多数学生选择的是D项。该试题甫一呈现,随即引发广泛的争议。有高度赞扬的,认为题目的设计很有水平:“短短20来个字考查了除法的整数运算、对单位的理解、知道并能运用商品售价应高于进价的常识”“很灵活”“题目出得好”,等等;也有大量质疑批判的,主要集中在:“考学生的生活经验还是考数学?”“考阅读理解么?”“考数学?考语文?还是考奸商潜质?”“什么是合理,合理售价包含成本(税费、工资、房租等)和利润,如何营利是件复杂的事情,成本测算的依据何在?”一些教育理论工作者还对该试题的育人价值提出异议:“三年级学生还太小,过早沾上铜臭就危险了。”“通过题目告诉孩子要赚钱,这样的导向是错误的。”甚至有观点认为这样的试题“泯灭人性的善”,等等。还有不少朋友结合上海当前的物价水平和生活现状,对试题情境的现实感和可信度表示怀疑:“出题的人肯定没买过小提琴”“这小提琴也忒便宜了”“进价400售价498,我是不信的”,诸如此类;也有意见直接抨击试题设计在故意“挖坑”,“这是文字游戏,数学是语文老师教的”“转好几个弯呢”“差点掉坑里”。个别热心的朋友还进一步给出了建议:“看过国外的一些小学联系实际的应用题,基本都框在如何合理地支配金钱上,很少涉及营利。”“小学生数学应用题应该出一些最优化相关的算术题才能体现数学的魅力。”
  这究竟是一道怎样的试题,有一线教师给出评判试题优劣的标准——“不偏不难做不对”。除了这个立足难度、区分度的视角,对任何一道试题的评析都需要从试题的科学性、政治性与公平性3个维度展开:科学性主要指试题整体及其结构要素所涉及的素材信息、概念原理和论证推断等准确可靠,不能有错误或有歧义;政治性主要指试题要“立德树人”,体现正确的政治方向,考生在作答时不会因自身的社会与经济地位、家庭状况、民族、性别和信仰等感受到被冒犯和/或被歧视;公平性主要指试题不会系统性地高估或低估某一特定群体的考生。由此,分析该试题,其立足的线索材料自身具有一定的科学性与合理性,试题的表述是准确的,作答指令也是明确无歧义的,试题的政治性和公平性亦可得到保障。因此,能够肯定这至少是一道合格的测试题,问题在于,该试题能否称得上是一道体现核心素养的优秀试题?在当今提倡核心素养的时代,以核心素养为本位的试题应该具有哪些关键特征,试题命制及评议应遵循的标准有哪些,这些问题值得梳理和辨析。

2
核心素养本位测试题的关键特征

  “测试想要测的到底是什么”,这是设计一个测试首先要明确回答的问题,对这个问题的回答对应的术语称为构念(construct)。构念集中体现测试想要测量的被试某方面的特质,是研究人员为了进一步明确测试任务或目的而进行的自觉创造,是对不易直接观察到的被试行为的概念性抽象,以构念为依据也是试题设计、审核以及评议的基本出发点。当下,我国正在以核心素养作为统领理念进行基础教育的课程改革,核心素养的理念及其内涵我们或许并不陌生。需要明确的是,当核心素养作为测试构念时,什么样的行为或表现能够体现核心素养?什么样的任务或情境能够诱发这些行为?
  核心素养不只是各学科领域具体的知识和技能,也不是传统意义上所理解的认知能力,而是个体在特定情境中成功应对复杂需要的能力,是个体在应对和解决复杂现实问题时的综合品质。核心素养在学生与情境、问题的有效互动中形成与发展,并通过具体的情境和测评任务表现和展示出来。当核心素养作为测试构念时,那些需要调动知识、认知和技能以及情感、态度、价值观等社会心理资源的行为或表现是能够较好体现核心素养的。个体所具备的核心素养及其水平难以直接观测,必须借助考生在具体任务完成过程中的实际表现加以推测。
  核心素养本位测试题的关键特征何在?其设计理念及评判标准与传统测试又有着怎样的区别?笔者认为:首先,核心素养本位的测试具有整合性。学科核心素养是学生学习该学科课程后应达成的正确价值观念、必备品格和关键能力。核心素养本位的测试重点关注学生通过后天学习形成的综合性学习结果,既可以表现为本学科与跨学科知识技能的整合,还可以体现在隐性的知识和价值观念的有机融合。其次,核心素养本位的测试依托情境。要合理测评核心素养,必须依赖于创设合理的、真实的任务情境,才有可能实现。合适的问题情境是考查核心素养的重要载体,在命题中创设有意义的测试情境,建立试题与社会生活的有机关联是一项关键工作,也是核心素养本位测评的质量基础。再次,核心素养本位的测试指向问题解决。核心素养更加关注学生能运用学到的做什么,而不单单在于学生是否掌握了特定学科的课程内容,因为前者是对个体或社会更有价值的学业成就。核心素养本位的测试依托具体情境呈现任务与问题,其设问(作答指令)指向具体任务的问题解决。

3
是以谓之“好”:整合性、依托情境及问题解决的深度融合

  当立足核心素养对本文引述的这道试题进行评析时,可以看出,这道试题需要小学生立足社会生活展开数学推理,首先要对用生活语言表达的具体情境进行“数学化”,通过必不可少的数学抽象,完成由生活问题向数学学科问题的思维转换,随后再调用数学中整数除法的算法知识,最后还要把这个运算结果代回试题的情境中,进而作出合理的判断。对这道试题的正确作答或者说基于该情境的问题解决建立在上述3个步骤的基础之上,最后这个环节的设计与PISA数学中“解释、应用和评价数学结果”的考查高度吻合,也是试题设计的亮点所在,因为整数除法这一数学学科的特定知识不再是测试的唯一着眼点,测试还考查运算结果的社会意义,学生需要对运算结果的合理应用进行立足情境的辨析和决策。相比而言,传统测试题大多局限在认知领域,而且以对分科知识点的孤立考查为主,不关注甚至干脆完全剥离知识所应用的现实世界,较少涉及学生对不同学科知识的整合能力,尤其不涉及内隐知识和态度价值观等。质疑意见中“这算哪科的测试”既反映了公众对传统测评范式的习以为常,又凸显出该试题的测试指向在体现数学核心素养时的整体性、综合性。
  从试题情境设计的角度看,《普通高中数学课程标准(2017年版)》提出了对测试情境设计的评判标准:“测试情境的设计是否体现数学学科的核心素养,提出的数学问题是否合理自然,解决问题的方法是否为通性通法,情境与问题是否有助于学生核心素养的达成。”虽然这是面向普通高中的,但基本理念同样适用于义务教育学段。客观地看,该试题的情境与设问相互依托、有机融合,设问能真正嵌入试题情境中,情境为任务的完成提供必不可少的线索,因此数学问题的提出是合理的、自然的。
  从试题关涉价值观念的角度看,作为一种综合的问题解决能力,核心素养不仅由学科核心素养和跨学科核心素养构成,还涉及情感态度价值观、关注知识技能运用和问题解决的价值取向。对于“售价合理”的判断,要求三年级小学生具备“商品售价要高于进价”的社会常识,这一常识是学生思维链条中价值推理的基本依据和判断标准。至于三年级的小学生懂得这一社会常识,就会沾染铜臭味,起到不好的价值导向,诸如此类的担忧和顾虑则大可不必,因为合理营利是商业文明和经济体系运营的基本法则,大可不必因为公益的崇高就贬斥商业活动的价值与营利的正当性。之所以有这么普遍的担忧,与长期以来基础教育在进行价值观教育时过于追求“毫不利己,专门利人”的立意有一定的关联,过高的道德定位导致经济议题的讨论呈现“泛道德化”的倾向。有必要澄清的是,合理的营利本身是值得尊重的,也是建设性的公民应具备的价值观念和态度,这与立德树人一点都不矛盾;还需说明的是,“售价要高于进价”是这道试题正确作答需要用到的内隐性知识,尽管这一内隐认知的获得渠道有的来自于家庭,有的来自于社会,有的来自于学校,即核心素养的形成过程是复杂的、来源渠道也是多元的。当然,不同学习阶段学生的内隐认知和问题解决能力是有层次差异的,应根据学生的认知规律,设置不同复杂程度的情境以测评素养水平的不同等级。本试题中这一内隐性知识对三年级小学生是应知应会的社会常识,如果真有小学生不理解,学校有必要提供一定的贴近生活的财商教育。
  此外,就公众对“售价合理”中“啥叫合理”的集中批判而言,这类意见指向的其实是核心素养本位测试所依托情境的真实程度的问题。在上海,有的小提琴真实售价或许高于甚至远远高于498元,但是,现实生活纷繁多样,有着近乎无限的丰富性,售价498元甚至低于该价格也并非绝无仅有。试题的情境毕竟不是也不可能是对现实环境的全然照搬,而是一个经过遴选、加工和再造的微场景,因此,不必过于苛求所谓的“真实”,因此,400元、498元的设定并不影响该试题的现实感和可信度。另外,关注现实生活虽然是核心素养测试的“基因”,但一道选择题无法也没有必要去充分探究在综合考虑税收、员工工资、市场行情、利润大小等因素的情况下售价究竟比进价高多少才更合理,也无须考虑特殊情况下,比如,乐器商店搞促销或者做公益、亏本甩卖时售价的合理性。这个角度上的批判或许表明,公众包括一些教育研究者可能尚未意识到标准化测试自身是有限度的,一道选择题不可能也没有必要涵盖丰富社会生活的所有方面。因此,核心素养本位测评范式下,考生对标准化测试题的作答和各界人士对试题的评析就不能太钻牛角尖,而是应当遵循“满意原则”,即达到测试的基本要求即可视之为满意。标准化测试尽管有其应用限度,但仍是教育普及阶段教育测试的重要方法,因为测试效率高而且相对准确。以PISA为代表的标准化测试通过创设测评情境,确实也可以较好地考查出学习者的核心素养,这方面的成功经验值得进一步借鉴。
  实践能力相对薄弱是我国中小学学生发展不容回避的基本学情,也是上海学生参与PISA项目所反映出来的突出问题。国家的各类教育政策文件常常呼吁,要依据义务教育课程标准确定考试内容,提高命题质量,减少单纯记忆、机械训练性质的内容,增强与学生生活、社会实际的联系,注重考查学生综合运用所学知识分析问题和解决问题的能力。这道测试题立足社会生活,整合性、依托情境及问题解决3个方面深度融合,确实可以称得上是一道体现核心素养的优秀试题。当然,白璧微瑕,为了避免小学生由于审题不仔细、粗心马虎导致的作答错误,最好对“售价合理”这一关键词语做突出标示,如加黑、斜体或下划线等,以缓解对试题设计故意“挖坑”的质疑。
  在我国,关于核心素养的研究尤其是对核心素养进行测评的研究刚刚起步,如何通过微观试题试卷的设计将学生的核心素养测评出来,进而引领和督促核心素养的有效落实,是我们当下面临的一个重要课题。合适的问题情境是核心素养本位测试的重要载体,近年来,国内教育测评对情境的独特价值有所认可,基于情境的测评实践也逐渐丰富;但总体而言,情境的设计与开发仍是当前我国核心素养测评的短板,这是因为设计合适的情境、提出合适的数学问题是有挑战性的。本文所举这道试题展现出中小学一线教师的测评素养和创新热情,尤其是自觉探索的专业精神,这弥足珍贵,无疑值得大力倡导。与此同时,这道试题所引发的广泛争议也提醒教育研究者在推进基于核心素养的测评范式转型时积极引导社会舆论的必要性。



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

×
淘宝网搜索“星韵地理网店”地理教辅、学具、教具专卖。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

QQ|Archiver|小黑屋|星韵百科|星韵地理网 ( 苏ICP备16002021号 )

GMT+8, 2024-4-24 09:45 , Processed in 0.100703 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表