美国科学教育评估的新动向及启示

永答英语 2024-08-24 03:11:55

感谢您关注“永大英语”!

美国科学教育评估的新动向及启示

荆 鹏 吕立杰

摘要:教育评价改革关乎科学教育的高质量发展。为适应未来经济社会发展和提升教育全球竞争力,美国时隔20年后对NAEP科学评估框架进行了结构性更新。NAEP2028科学评估框架以科学学科概念、科学与工程实践、科学跨学科概念作为三大测评维度,重视依托高质量的情境,设计具有连贯性、进阶性和整合性的多样化测试题目,同时将科学意义建构理念贯穿所有测试题目,并采用数字化手段实施测评。为尽可能避免因简单归因产生的误区,NAEP测评结果报告强调结合特定背景变量进行分析。借鉴美国经验,我国科学教育评价改革应立足科学素养目标,关注真实情境创设,积极推进评价数字化转型,并注重结合背景变量对评价结果进行多维解释。

关键词:NAEP;科学教育;教育评价改革;教育数字化;跨学科科学教育是提升国家科技竞争力、培养创新人才、提高全民科学素质的重要基础。近年来,随着我国科学技术普及法的修订以及教育部等多部门在中小学科学教育领域实施的改革,我国科学教育迈入了新的发展阶段。然而,我国科学教育工作涉及面广、系统性强、挑战性大,总体基础薄弱[1],尤其是作为教育“指挥棒”和“风向标”的评价环节,仍存在重结果、轻过程、对评价结果不够重视等突出问题[2]。既有研究多是对学生在科学学习中的某些单一表现予以考查[3-4],还有部分研究尽管关注到了不同群体的科学素养表现[5],但也只是通过标准化测试分数来评估学生的科学能力,无法克服样本依赖的局限性[6]。总体而言,现阶段我国科学教育监测环节尚缺乏体系化、基于课程标准的科学教育测评框架,亟待构建一套适应时代发展的监测评估体系。

教育评价改革是一项世界性、历史性难题,关乎科学教育的高质量发展。纵观全球科学教育评价改革,主要发达国家和知名国际组织都试图通过修订相应的科学教育评价标准来发挥大规模科学教育评价的作用,以反馈教学实践质量、支持政策决策完善、提升科学教育的整体水平。美国作为科学教育领域全球领先国家,在科学教育评价领域积累了丰富经验。在美国,国家教育进步评价(National Assessment of Educational Progress,NAEP)是具有代表性的教育持续评估项目,在世界范围内也颇具影响力。自1969年实施以来,NAEP从科学、阅读、数学等多个维度持续对四、八、十二年级学生的学业发展进行大规模测评。NAEP科学评估框架在保持历史连贯性的同时,也适时进行框架调整以应对科学教育理论与实践的变化。上一次更新的科学评估框架结构是在2006年发布的2009NAEP科学评估框架,这一版本框架不再沿用于1991年制定并应用于1996年、2000年和2005年科学评估的框架(以下简称“1996—2005框架”)结构。随后,美国国家评估管理委员会又分别于2011年、2015年、2019年三次发布新框架,但均是在NAEP2009评估框架基础上对所要评估的科学内容、问题类型和数据管理进行了小范围的修订(以下简称“2009—2024 框架”)。时隔近20年后,美国国家评估管理委员会(National Assessment Governing Board)于2024年再次修订科学评估框架,并将其命名为 2028NAEP科学评估框架(2028 NAEP Science Assessment Framework,以下简称NAEP2028),给出了未来一段时期美国科学教育评估的具体方案和行动框架,其内容和方向对于我国深化科学教育评价改革具有一定借鉴意义。

一、NAEP2028科学评估框架的发布背景

新世纪以来,面对以知识创新和科技应用为主要特征的知识经济,为适应未来经济社会发展和提高国际教育竞争力,美国国家评估管理委员会组织专家团队基于《国家科学教育标准》(National Science Education Standards,NSES)、《科学素养基准》(Benchmarks for Science Literacy)以及认知科学、教育评价等诸多领域的前沿研究成果,开发了涵盖科学内容、科学实践两个维度的2009NAEP科学评估框架,并进一步丰富了测试题目。然而,2009NAEP科学评估框架发布实施后不久,美国学校的科学教育实践经历了又一次根本性变革,即NSES被2011年发布的《K-12科学教育框架:实践、跨学科概念和核心概念》(A Framework for K-12 Science Education: Practices, Crosscutting Concepts, and Core Concepts,以下简称NRC框架)以及其衍生的《新一代科学教育标准》(Next Generation Science Standards: for States, by States,NGSS)所取代。后者通过新近科学研究为中小学科学教育提供了一个全面的、循证的评估标准基础,并明晰了中小学学生应该知道的科学范畴,提出了融合内容性知识、跨学科概念以及实践的“三维科学学习”(three dimensional science learning)理论。在过去十年中,美国绝大多数州根据NRC框架、NGSS中的基本理念和定义制定了评估标准[7]。在这一背景下,不同的概念框架加剧了NAEP科学评估框架与NGSS的分歧,导致的差异在学生测评表现中愈加明显[8],这极大地挑战了NAEP科学评估的有效性和实用性。

因此,各利益相关方呼吁对NAEP科学评估框架进行全面修订,以确保该框架紧密贴合未来一段时期的教育实践和学生发展需求,契合NRC框架和NGSS中描述的科学教育愿景,进而作为持续衡量全美学生科学学业成就的重要工具。相较于以往的框架开发,美国国家评估管理委员会在新一轮修订过程中更新了开发流程,旨在增强公众透明度、多领域专家及教育实践者的参与度,如首次组建教育家顾问委员会、深入访谈不同利益相关方、以领导团队取代单一主席角色以实现集体化和多元化的决策指导等。经过多轮反馈以及正式的公众意见征询流程后,以NRC框架为蓝本并融合当前科学研究新近成果的NAEP2028科学评估框架最终于2024年1月在NAEP网站上正式发布。NAEP2028将为教育工作者、美国各州和地区领导人、政策制定者以及科学和商业界人士提供学生科学学习的指南。同时,根据该框架更新的NAEP评估也将促进各方更深层次、全方位地了解学生目前对科学的理解水平以及未来教学改革方向。

二、NAEP2028科学成就评估的三维架构

相较于2009—2024框架,NAEP2028不再沿用科学内容与科学实践这两个传统测评维度,而是进行了结构性更新。将科学成就定义为从学科概念(disciplinary concepts)、科学和工程实践(science and engineering practices)以及跨学科概念(crosscutting concepts)三个维度出发来识别和解决问题、理解现象以及评估信息并做出明智决策的能力。三个维度各有独特性又高度关联、互为嵌套,呈现了一个全新的科学素养评估框架。NAEP2028科学成就的三个维度在很大程度上反映了NRC框架中科学成就的三大维度,但NAEP科学框架仅作评估之用,而非课程框架,因此并没有涵盖每个年级的所有教学内容,同时避开了不适合在NAEP进行评估的概念、实践和活动。

(一)NAEP科学学科概念

NAEP科学学科概念与2009—2024框架的科学内容维度所包含的三大领域(物理科学、生命科学、地球和空间科学)相一致,但涵盖的主题与子主题更具科学性、规范性,如表1所示。NAEP科学学科概念的选定理念基于制订NRC框架的专家组推荐,体现了美国各州及国家标准、权威组织的政策或报告中对科学成就的期望变化。其选定过程尤为关注学科领域的核心原则,选择的都是在科学学习中具有重要意义且持久、可测量的核心概念,可以为学生建立对科学的深入理解提供基础性支撑。这些厘定的NAEP科学学科概念在力求年级适切性和内容准确性之外,亦符合大多数州的教学标准,可以增强评估内容的实际应用性和教学相关性。

NAEP设计了一套编码系统,通过字母和数字的组合对不同年级和内容领域的学科概念进行有序分类。这有助于快速识别和定位教学内容,便于年级间的内容对比,同时也为评估和研究的标准化提供了便利。例如,编码L12.10表示生命科学学科概念的十二年级部分中的第10个概念。

(二)NAEP科学与工程实践

2009—2024框架中的科学实践维度包含辨别科学原理、使用科学原理、进行科学探究、进行技术设计四个要素,但这与NGSS中科学实践所倡导的价值理念并不契合。美国科学教育专家Pellegrino也对此提出质疑,认为四个要素中的前两项更侧重于“了解科学”,而另外两项则更侧重于“做科学”[9]。相较于2009—2024框架,NGSS提高了对科学与工程实践的要求,并将这些要求与科学教育内容相结合以设定学生科学学习的成绩目标,由此导致的评价差异变得更为明显。

为解决此类问题,NAEP2028不再沿用此前的科学实践四要素,转而引入“四类八步骤”的NAEP科学与工程维度,包括:1)调查(提出问题和定义问题,规划和开展调查);2)分析(分析和解释数据,运用数学和计算思维);3)解释(开发和使用模型,构建解释和设计解决方案);4)评价(依据证据进行讨论,获取、评估和交流信息)。NAEP科学与工程实践维度包含了与科学成就相关的技术和工程概念,主要从科学解释并研究现象、设计工程的解决方案两个方面,对学生参与科学与工程的实践能力和应用跨学科概念的能力进行考查。具言之,在科学解释方面,NAEP2028要求学生能够准确应用理论对特定情境或现象进行解析,进而评估学生将当下对科学的理解与证据相结合以形成一致且连贯的解释的能力;在工程设计方面,侧重于学生在遵循技术使用适宜性和伦理规范的前提下,针对各种现实问题提出解决方案的实际操作能力,考核则包含设定项目标准、策划设计路径、制作与验证模型、对比优选最佳方案、依据反馈迭代改进设计的全过程。

为了全面考查学生在多元情境下将所学科学知识应用于解释科学现象或设计方案以解决工程问题的能力,NAEP规定每次科学评估中至少10%的题目须涉及调查、分析、解释和评价四个类别。NAEP科学与工程实践这一维度的考查内容,主要集中在大规模评估中可进行量化的关键探究实践行为,且在框架中进一步明确了“四类八步骤”对不同年级学生的要求,注重对学生能力的阶段性发展进行精细化评价。

(三)NAEP科学跨学科概念

跨学科概念是科学研究中的重要概念范畴,其跨越学科间壁垒,可以在解释、理论构建、观察及设计中展现出丰富的思想价值[10],是一种体现科学本质观的上位思维工具。在美国科学教育的发展历程中,跨学科概念先后使用了通用主题(common themes)、统一概念(unifying concepts)等名称[11-12]。尽管名称不统一,但其内涵近似、发展连贯。NRC框架中的跨学科概念是目前美国跨学科概念发展最为成熟的概念体系。作为科学概念体系中的上位概念,跨学科概念具有很强的抽象性、综合性和进阶性,这也是先前一段时期美国学界未将其纳入评估框架进行大规模测评的重要原因之一。

NAEP2028认为,那些普遍适用于科学与工程领域的跨学科概念应作为学生科学教育评估的重要有机组成,这是因为跨学科概念可为学生理解真实世界中的自然现象、解决现实中的挑战性问题提供一套通用工具。缘于此,跨学科概念首次作为独立维度出现在NAEP科学评估框架中,其构成参照了NRC框架中的相应体例,并对七个NAEP科学跨学科概念做出了具体解释,见表2。

就NAEP科学跨学科概念的构成要素数目而言,有单一要素概念,如“模式”概念;还有涉及多个要素相互作用的复合概念,如“尺度、比例与数量”概念就包含三个要素。此外,根据其构成要素的复杂性和相互作用的层次性,还可将概念进行多阶划分。例如,“模式”与“机制与解释:原因和结果”是一阶跨学科概念,构成了理解科学的基本单元;而二阶跨学科概念,如“结构与功能之间的关联”则进一步深化和拓展了对模式和因果关系的理解,通过分析不同组件的形状、大小如何影响结构与功能的关系,体现了因果推理的进阶性[13-14]。在NAEP2028的设计中,跨学科概念作为整合评估的关键纽带,与其他两个科学成就维度相统整,形成了三维科学评估框架。这也要求开发者在设计测试题目时注重涵盖NAEP科学跨学科概念的多维向度,通过选取不同的跨学科概念,力求实现对科学教育内容的有效覆盖以及对学生能力水平的准确监测。

三、NAEP2028科学评估框架的关键特征

此次评估框架内容和流程的更新,一方面汲取了深度学习、学习进阶等认知科学领域的前沿研究成果和国际课程改革经验,概述了美国本土四、八、十二年级学生应掌握的学科内容知识,尤其是跨学科概念等内容;另一方面,也充分考量美国本土多元文化背景和群体间存在的学习机会差异,对科学教学的环境和评价提出诸多新的要求,反映了追求公平与包容的科学教育理念。回溯NAEP2028框架的研制背景与历程,可以发现其继承了NRC框架、NGSS框架的价值理念,并对1996—2005框架和2009—2024框架在评估中发现的问题予以纠偏和完善,致力于勾勒信度高、操作性好、有效性强的全美国科学教育评估蓝图。概而言之,NAEP2028具有以下四个关键特征。

(一)聚焦科学意义建构,指向连贯与进阶的三维整合

科学教育既包括对科学知识体系的学习,亦包括对科学知识产生的一系列过程的学习。在所有测试题目中融入科学意义建构(scientific sense making)概念是NAEP2028重要的更新变化之一。科学意义建构是一个动态的、持续的过程,它涉及建构和重构解释,以及在多种表征和知识中寻求一致性和意义[15]。这一过程不仅需要实践,还需要技能和知识,包括从认识论层面上理解知识生成的过程。换言之,科学意义建构作为科学学习的积极协变量(positive covariate),是促进学习者通过跨学科统整、迁移应用知识和经验去获得问题解决技能的过程[16]。因此,意义建构可以被视为连接科学三个维度与NAEP2028所定义的科学成就的“黏合剂”。NAEP2028将科学意义建构的过程分为四个阶段,可概括为感知接受、挑战质疑、整合重构与迁移应用。这四个阶段构成了科学意义建构过程的关键步骤,学生可以逐步建立对知识的深层次理解,从而有效应对新的现象和问题。

与考查知识记忆的题目相比,NAEP2028科学测试题目将重点探查学生参与科学意义建构的水平,即积极应用学科概念、科学和工程实践以及跨学科概念来分析现象或解决现实问题的综合表现水平。在对科学意义建构的考查中,连贯性、进阶性和整合性是测试题目设置的重要原则。具体而言,连贯性是指测试中的题目在逻辑上有紧密的关联,使学生可以在解答过程中展示清晰的思路和合理的推理链。此外,连贯性不仅体现在题目之间的关联衔接,还应包括题目内部的逻辑结构和信息组织方式。进阶性则指题目应具有一定的难度层次,问题设计具有思维性和挑战性,能够激发学生认知,与既有经验进行“对质”,以考查学生对科学概念的深层理解程度与解决复杂问题的能力水平。整合性是指通过真实性任务,综合考查学生对科学跨学科概念、原理的理解和迁移运用能力。概言之,NAEP2028主要依托高质量的测试题目对学生构建科学意义的能力实施测评,而非通过大量复杂计算、反直觉的科学内容进行测评。

(二)依托高质量的情境,设计多元化样态的测试题目

测试题目是评价的基本构成单元,NAEP2028为大规模评估的测试题目设计提供了明晰的价值路向。现代学习理论主张专家具备的知识是“条件化的”,他们了解自己所拥有的知识可以在何种情境中使用以及如何使用[17]。因此,NAEP2028提出,高质量的情境是所有NAEP科学测试题目的基础,依托高质量的情境设计多元测试题目是其未来进行科学评估的核心理念,目的在于从根本上扭转科学评估脱离情境且考查维度单一的困境,全方位衡量学生的科学成就。

首先,NAEP2028明确了高质量的情境的三大基本特征:有具体实例(a specific instance)、真实不确定性(authentic uncertainty)、对特定社群的相关性(relevance to particular communities)。具言之,一是需要融入现实世界的现象或实验这类生动具体的科学实例,增强试题对学生的吸引力和激励性,以考查学生所学知识与实际情境之间是否构建起了有意义的联结;二是设计中包含具有一定挑战性的真实任务,这些任务的不确定性指向科学探索不可规避的未知因素,可以深入考查学生的问题解决能力、批判性思维等高阶能力水平;三是应考虑学生群体特有的环境挑战、社会经济状况、文化价值观等因素,关注学生社会与情感能力在科学学习过程中的发展。在具体的测试题目中,创设高质量的情境应遵循学生的认知、思维和心理发展图式,为学生认知参与搭建桥梁。

其次,NAEP2028引入复杂性框架(com⁃plexity framework),对意义建构的复杂性和题目提示的详尽程度进行了细致考量,为科学规范地开发多元化测试题目提供了有力支持。评估由选择题(selected response items)和结构性问答题(constructed response items)通过不同的组合方式生成四类考查题目,并要求至少使用科学成就的两个维度进行科学意义建构。多元化的测试题目可实现对学生科学成就的全面评估,同时为创设高质量的问题情境提供恰当的载体。例如,“基于情境的任务”这一测试题目设计时整合了更为详尽的文字描述、图像资料与数据信息等资源,其丰富的情境可以支持更多元的任务表现形式并提升子任务间的逻辑关联度。而在施测阶段,测试题目通常仅提供学生解决问题所必需的信息,以使来自不同学习背景的学生能够准确理解任务要求,引导其应用目标维度的知识与技能进行作答。为此,设计NAEP科学测试题目时将经过各利益相关方的评审、预测试、试运行及多次修订等开发流程,以确保测试题目的信度、效度和公平性。

(三)引入数字测评工具,从纸笔测评转向数字化评价

评估多维科学学习水平时,技术工具在概念化、设计、数据收集和结果解释等各环节均可发挥至关重要的作用[18]。尽管数字化评价和纸笔测评在评估内容范畴、目标理念方面本质上是一致的,但基于数字场景的评估可为学生提供展示解决问题和分析性思维(analytic thinking)等重要技能的平台,而这些技能不容易通过传统的纸笔测验来衡量[19]。因而,NAEP科学评估于2019年起已完全基于数字化平台实施与管理。NAEP2028为确保能够基于数字环境对三大测评维度进行更全面、更准确的考查,依托数字化平台系统引入了包括特定科学工具在内的多种数字工具,并设计了高交互性的测试题目。

在引入数字测评工具方面,NAEP2028具有三个方面的特征。

一是具有较为完备的数字化平台和传递交付系统,可以实施高效率、多视角的数据采集,如图1所示。

平台系统会持续采集、分析学生在完成测试题目时的过程数据,并将其作为评估学生是否具备预期目标技能的关键凭证。由于家庭社会经济地位、社会文化背景等差异可能会导致学生在使用数字工具时出现“数字鸿沟”,NAEP实施评估前会为不同学生群体提供定制化的平台使用教程,以帮助学生掌握这些工具的规范操作流程。

二是通用与专用工具相结合。NAEP2028既包含适用于所有NAEP评估的系统工具,也包含在NAEP科学评估特定题目中使用的科学和数学专用工具,兼顾评估工具的普适性和学科特性。

三是聚焦数字工具应用场景,真实模拟并还原探究实践过程。评估使用模拟和建模工具展现难以实时观察或肉眼不可见的科学现象,如慢动作观察波的运动、高速观察河流造成的侵蚀、模拟气体中分子的运动等。这样的设计真实模拟了现代科学研究借助数字技术揭示复杂现象的过程,提升了评估的生态效度(ecological validity),即通过测评更真实地呈现学生在实际科研情境中运用数字工具的能力水平。此外,出于标准化考试可操作性与公正性的考量,NAEP2028取消了此前版本中的概念图(concept maps)和动手任务(hands-on tasks),以保持大规模评估的实施效率以及评分的一致性。值得一提的是,在向数字化评价转型期间,NAEP还将学生在这些评价中的表现与在传统纸笔测评中的表现进行了比较研究,致力于保持NAEP报告学生成绩趋势的功能,并对数字化评估的可靠性、有效性、透明度和实用性进行持续分析研究。

(四)厘定背景变量信息,科学分析评价结果多维差异

测试结果通常会呈现群体差异,如何对差异进行有意义的解释是长期以来人们关注的焦点。NAEP2028认为,将学生群体类别视为导致成绩差异的直接原因(如性别与成绩的关系)是一种常见误解。有研究表明,学业成就水平差异更多源自不同学生群体之间学习机会的不平等[21]。如果仅关注成绩差距而不探究背后的机会差距,会误将分数差异归因于学生个体的能力差异,而非教育体系导致的机会差异。因此,NAEP2028参照《教育与心理测验标准》(Standards for Educational and Psychological Testing)中的建议,在报告评估表现的群体差异时,尽可能附带相关背景信息,以规避单一向度的错误解释,使差异分析具有实际意义[22]。NAEP2028筛选的背景变量(con⁃textual variables)具有主题相关性、时效性等特点,尤其是厘定了一系列特定的背景变量。这些背景变量的系统性设定为深度解释影响学生科学学习的多元因素提供了基础保障。然而,影响学生学习内容和动机的因素类型繁多,囿于时间限制无法全部囊括,且NAEP法规禁止收集个人或家庭信仰和态度信息。因此,NAEP2028为接下来的背景变量调查问卷设定了五个重点关注的变量(按优先级排序),以期提供丰富、有针对性的背景数据,对学生科学成就进行全方位解释,如表3所示。

可以看出,NAEP2028在遵循法规的基础上,系统整合了多维度的背景变量,并实施优先级设定,为分析评价结果提供了全面、准确、可操作的现实依据。这有助于科学教育政策制定、教学实践优化以及学术研究,进而可以增进社会监督与公众理解,推动科学教育质量与公平性的提升。

四、NAEP2028对我国科学教育评价启示

整体而言,NAEP科学评估立足于国际课程改革趋势和最新科学教育标准,通过技术赋能来保障测评工具的效率和质量,注重对学生科学素养的全面监测,并且持续优化评估框架的构成要素。我国中小学科学教育测评可从立足素养目标、关注真实情境、因应技术发展、重视机会差异四个维度参考借鉴NAEP的经验。

(一)立足素养目标,聚焦科学学习的意义建构

科学学习并非是从简单具体到复杂抽象,或从简单的逻辑修正到理论的零碎信息的积累过程[16]。立足素养发展目标,引导学生像科学家一样思考,衡量其在科学学习方面的意义建构是NAEP、PISA等大规模科学评估新近的实践锚点。正如OECD在《OECD学习指南2030》(OECD Learning Compass 2030)中强调应帮助学生“在陌生环境中确定航向”(navigating oneself),科学学习需要帮助学生找到应对不确定性的正确方法。事实上,科学意义建构作为促进学生深度学习的过程,需要学生在多种表征和学科知识之间进行论证、推理,以对科学形成全面、一致且深刻的理解[15],这对培养能够适应未来社会的人才来说是不可或缺的重要环节。

新世纪以来,我国科学教育评价进入深化改革阶段,从事实性知识考查转向以素养发展为目标的综合评价体系构建,例如,在《义务教育科学课程标准(2022年版)》中进一步明确了评价的价值导向,即“以课程目标和学业质量标准为依据,构建素养导向的综合评价体系”[24]。但总体而言,我国现阶段科学教育评价仍倾向于通过程式化的科学内容和结果性指标对学生进行考查,而对学生认知冲突、自主建构、自我监控和应用迁移的多维衡量尚显薄弱。如何在评估中将关注点从考查知识记忆转变为考查能否基于实证进行科学因果推理与论证,进一步完善素养导向的评价体制机制,是未来我国科学教育评价深化改革的重要议题。一方面,要推进科学教育评价文化的建设。通过强化顶层设计和整体统筹以扭转量化为主的评价思维,从观念层、制度层、实践层出发,坚持立德树人本色,倡导综合性评价理念,营造良好的科学教育评价文化氛围。另一方面,要持续优化科学教育评价内容指标体系,注重通过兼具连贯性、进阶性和整合性特征的评价形式加强对学生高阶思维与深度学习能力的衡量。

(二)关注真实情境,指向科学本质的理解探查

科学素养是未来人才所必备的关键能力,对科学本质的理解则是发展科学素养的关键要素[25]。创设真实情境有助于促进学习者与现实世界的互动,对于提升评价质量,尤其是考查学生对科学本质的理解具有重要意义。正如现代学习理论指出的,个体的学习深受其所处的特定情境的影响[17]。NAEP2028对情境的关注实质上强调了学习者的地位及其学习环境的重要性,并侧重于科学现象在不同条件和状况下的意义脉络、它们之间的关系以及这些关系如何影响个体的认知、学习和发展,从而提供一个更广阔的视角来理解科学发生的深层次逻辑,这也是本次框架更新的一大亮点。

揆诸当下我国科学教育评价,对高质量的情境设计的关注仍显不足,如部分试题构造的情境过于简化、缺乏真实性等,无法有效激发和测评学生在真实世界中对科学本质的理解。以NAEP2028的理念与原则为参考,一方面,我国科学教育评价亟待将学习者对科学本质的理解纳入评价的全流程和全要素之中。另一方面,我国科学教育评价需要创设基于真实情境的多元化类型任务,融入现实世界的复杂性、不确定性,以激发学生在作答时的认知参与。值得注意的是,强调在评价中融入真实情境并非简单复制现实生活的每个细节。情境的真实(authenticity)源于现实但不等于现实(reality),高质量的情境应在围绕核心问题的基础上,遵循一定的进阶结构并顺沿任务主线进行深入融合,最大限度促进被评价者与情境互动,进而使其展现出知识建构和技能习得的实际水平。

(三)因应技术发展,推动教育评价数字化转型

数字时代的科学教育评价改革是教育发展、技术更迭、时代需求等多维要素互相交织的结果,映射出数字时代对评价范式革新的迫切需求。除 NAEP外,使用技术创设科学评估环境并将其作为评估工具,以规范衡量学生在数字化环境中的科学成就已成为国际科学教育大规模评估的主流方向。例如,PISA2025科学评估中新增设了“数字世界中的学习”评估,侧重于对学生在数字世界中的计算和科学探究实践、自我调节学习两项能力进行评估[26];TIMSS2019启用了基于计算机辅助测评技术的数字评估形式——eTIMSS,旨在有效采集学生处理复杂任务的过程数据[27]。

目前,我国科学教育评价仍以传统的纸笔测评为主,对学习者在数字化环境中运用科学知识、技能表现以及使用数字工具解决问题的能力考查不足。究其根本,可归因为技术平台系统的开发不足、评价标准与数字化操作层面不匹配,以及学生数字素养欠佳。鉴于此,我国亟待推进科学教育评价领域的数字化转型,以突破现有测评模式局限。首先,要实现新标准与新技术的同步推进。这是一个涉及理念革新、技术应用和体系重构的系统工程,需要不同领域的专家协同合作。其次,需持续发展学生数字素养,引导其在科学学习过程中关注数字公民的科学身份建构与价值实现。最后,加大结果可信、技术可供、伦理安全的科学教育评测迭代式模型构建和关键技术研发力度,在参考主要发达国家科学教育评估典型案例的基础上,基于本土国情,因地制宜、因校制宜地向高质量数字化评价过渡。

(四)重视机会差异,发挥测评结果的反馈效能

在评价中充分考量学习机会的差异性,结合背景变量进行多维解释,对识别科学学习中的机会差异并采取补偿举措具有重要意义。在新型的“国家成绩单”(the nation’s report card)中,NAEP的结果将以NAE 0~300等级学生组的平均分数以及达到三个成就水平(基础、熟练、高级)的学生百分比进行报告。同时,还将强调结合特定背景变量对测评结果进行解释,以尽可能避免由于简单归因而产生误区。

就我国科学教育的评价变革而言,应权衡好监测质量与结果反馈的关系,在持续提升监测质量的同时,重视构建能够“精准把脉”科学教育现状的动态反馈与优化机制。一方面要重视评估中背景变量的规范采集,为学习机会的潜在差异提供解释信息,可建立一套标准化、科学化的采集体系,保障数据的全面性、准确性和伦理安全;同时,评价体系应具备动态更新机制以因应社会变迁,如及时纳入数字鸿沟、科学身份认同等背景因素。另一方面,要以深度数据分析为驱动,关注评价结果的解释和应用。通过强化跨学科合作与综合分析能力,透过跨学科视角进行多维解释,识别影响科学教育教学的复杂因素,为政策和教学策略制定及实施提供坚实的实证基础。此外,还应积极探索通过大数据、人工智能等数字技术构建更加精细立体的学生画像的可行性方案,为个性化科学学习的路径设计和教育资源的精准供给提供有效依据。

(参考文献 略)

(本文首次发表在《中国考试》2024年第7期)

0 阅读:1

永答英语

简介:感谢大家的关注