从亚里士多德到卢梭,哲学家们都相信,正常运转的民主是建立在受教育的公民基础上的。有证据表明,受过良好教育的人更有可能参与政治活动。然而,教育与政治参与之间的关联在不同国家之间存在差异,我们不知道不同国家之间的差异是否以及如何取决于政治体系的组织方式。
Louis Volante, Sylke V. Schnepf, John Jerrim 和 Don A. Klinger 本博文由叶王琼翻译。 经济合作与发展组织(OECD)传统上通过强调特定的教育体系来定义教育的卓越性,这些教育体系在PISA测试中成绩优异,同时在男孩和女孩、移民和非移民、高社会经济地位和低社会经济地位(SES)群体之间的差距很小。 我们的新书(Springer 2019,请参阅 https://www.springer.com/gp/book/9789811398629)包含了领先的学者对各国社会经济不平等和教育成果的研究,其中包括澳大利亚,加拿大,英国,芬兰,德国,意大利,荷兰,西班牙和瑞典等。每个国家的概况都提供了学生成绩成绩轨迹的概述,并把这些成绩与PISA和国家行政数据(如果有的话)关联。同时,还讨论了政策回应的有效性,以减少高社会经济地位和低社会经济地位(SES)学生之间的差距。 为什么社会经济地位和学生成绩是一个重要的话题? 社会经济地位和学生成绩之间的关系是一个及时的问题,至少有三个原因。首先是社会公正。孩子们不能选择他们的家庭和/或社会地位。因此,如果以后的生活机会在很大程度上是由一个人无法控制的因素决定的,这是“不公平的”。其次,不幸的是,不平等持续存在。教育可以作为创造代际流动性的驱动力,解决持久性问题(Goldthorpe, 2014)。然而,缺乏优质的服务可能有助于维持甚至增加这些不平等。第三,在一个竞争激烈的世界里,最大化一个国家的人力资源至关重要。如果来自贫困和弱势家庭的学生不能充分发挥他们的学术潜力,那么这一点就是不可能的。 社会经济不平等的轨迹是什么? 正如这一章的作者所阐述的那样,在大多数国家,社会经济不平等状况保持不变,甚至有所加剧,只有德国例外。根据2015年国际学生评估项目(PISA)的最新数据,那些社会经济背景较低和较高的学生,在学业成就方面的差距多达一到两年。这表明,各国显然需要进一步执行政策,以消除教育不平等。 哪些政策干预与社会经济不平等有关? 从国家概况中总结,影响社会经济成就差距的教育政策可以分为三个维度:跟踪教育与综合教育、学校自治与集中教育、课程与指导。 学校分流发现了最令人信服的证据,表明一项政策加剧了社会经济成就的不平等。分流是指引导学生进入不同的学校项目,不同的课程,不同的学习目标,不同的职业路径。分流通常与较低的全国平均成绩以及较大的学校社会隔离联系在一起。与使用学校分流有关的政策更有可能增加成绩差距。然而,从书中的发现也可以明显看出,分流、社会经济不平等和学生成绩之间的关系并不是普遍的。正如本章几位作者所强调的那样,孤立于具体的国家背景或与其他政策结合探讨的政策可能会导致过分简化或不准确的结论。 我们的研究,在欧洲委员会的政策摘要中也有总结(请参阅https://ec.europa.eu/jrc/sites/jrcsh/files/fairness_pb2019_educational_inequalities.pdf),这表明国家背景的复杂性使得跨国评估教育变得困难。因此,在使用PISA结果在全球范围内推广特定的教育政策干预措施时,应谨慎行事。
Marc Piopiunik 本博文由叶王琼翻译。 经济合作与发展组织(OECD)的国际学生评估项目(PISA)不断地说明了各国15岁学生在阅读、科学和数学方面的表现是如何不同的。教师素质的差异通常被认为是造成这些巨大差异的关键因素。在最近的一项研究中,我与合著者Eric A . Hanushek (斯坦福大学) 和Simon Wiederhold (KU Eichstätt-Ingolstadt) 使用了关于教师认知技能(教师素质的一个重要维度)的国际可比数据来调查这一说法。 发达国家的教师技能差异很大 我们使用来自经合组织成人能力国际评估项目(PIAAC)的独特数据,首次计算出31个国家/地区,教师计算和读写能力的一致性指标。图1显示教师的技能差异很大。例如,在我们的样本中,技能水平最低的国家(智利和土耳其),教师的平均计算和读写能力,远远低于加拿大仅接受过职业教育的成年人的水平[1]。相比之下,在技能水平最高的国家(日本和芬兰),教师的技能超过了在加拿大获得硕士学位或博士学位的成年人的技能。 教师技能部分解释了各国学生表现的差异 我们将这些国家级教师技能测量与PISA学生数学和阅读成绩的个人数据进行关联。图2显示,教师认知技能的跨国差异部分解释了学生成绩的国际差异。例如,如果教师的水平提升到芬兰教师(表现最好的国家)的技能水平,意大利和俄罗斯的学生,他们的数学成绩将大幅度提高 (将近一个学年的学习进度);西班牙,英国和美国的学生,则会提高大约四分之三学年的学习进度;如果每个国家的教师水平都提升到芬兰的程度, PISA成绩的国际差距减少约四分之一。 其他国家因素能否解释学生表现和教师技能之间的关系? 至关重要的是,我们的分析控制了许多其他因素,从而排除了我们结果的其他解释。最重要的是,我们通过计算教师在算术和读写能力之间的认知能力差异,来解释国家之间跨学科保持不变的所有差异(例如,教育支出,人口的平均认知技能以及一般文化背景,比如教育的重要性)。这种方法得出的结果类似于将教师的计算能力与学生的数学成绩联系起来,或将教师的读写能力与学生的阅读成绩联系起来。 其他分析强有力地支持了以下解释:我们的发现确实反映了教师技能的影响。当我们将学生的表现与PIAAC中评估的其他广泛职业(例如经理,科学家和工程师,卫生专业人员和商业专业人员)的认知技能水平相关时,我们发现没有系统的关系。只有教师的技能与学生在PISA中的表现始终相关。 政策制定者可以做些什么来提高教师的认知技能? 我们的国际数据还允许我们调查政策选择如何影响教师队伍的技能,并最终影响学生的学习成绩。 重要的是,我们发现教师工资溢价的国际差异(考虑到他们的性别,工作经验和认知技能)与教师的认知技能直接相关。 这些结果说明了增加教师工资的潜在价值。 但是,政策制定者需要做的不仅仅是全面提高教师的工资。为了确保取得积极的成果。他们必须保证最高效的教师获得更高的工资。 [1] 我们使用加拿大进行技能比较,因为加拿大迄今为止是PIAAC中最大的国家样本。
John Jerrim, Jake Anders, Silvan Häs, Nikki Shure & Laura Zieger 当国际学生评估项目(PISA)的结果每三年发布一次时,一些东亚国家/地区(如新加坡、台湾、日本、韩国)在这些排名中占据榜首也已经不足为奇了。这些国家基本上都比大多数说英语的西方国家做得好,只有一个明显的例外——加拿大。政策制定者和教育媒体并没有忽视这一点。事实上,在2015年PISA结果公布后,加拿大被描述为一个“教育超级大国”,人们用各种各样的理论(从移民的优异成绩到学生的高度积极性)来解释这一结果。事实上,经合组织PISA项目负责人安德烈亚斯•施莱歇尔 (Andreas Schleicher) 暗示,加拿大对公平的坚定承诺才是关键所在。 但是我们对加拿大PISA的结果到底有多少信心呢? 国际学生评估项目的一个关键就在于它代表了每个国家15岁的人口。如果做不到这一点,那么我们就不是在进行同类比较。例如,如果A国不成比例地排除某些学生群体,那么它就不能与B国进行公平的比较,因为B国有代表性的各个阶层的年轻人确实参加了活动。例如,如果不同国家对有特殊教育需要的儿童区别对待,就可能出现这种情况。另外,在一些国家,大量的学生和学校可能会拒绝参加这项研究。 事实是, PISA遇到的这类情况——我们认为,很可能会严重破坏加拿大的结果。 这一点在图1中可以看到,图1参考了PISA 2015技术报告中的数据。显然,加拿大的数据是惊人的。只有大约一半(53%)的加拿大15岁学生参加了PISA 2015评估。相比之下,日本和韩国超过90%的15岁青少年都参加了。 为什么加拿大的数据看起来如此糟糕?原因有很多。 首先,加拿大的学校比其他国家的学校更有可能拒绝参加,加拿大的国家报告在魁北克省内标记了特殊问题(其中不到一半的学校同意参加,请参见表A2)。 如果某些类型的学校(例如,表现较差的学校)比其他学校(例如,表现较好的学校)参与的可能性较小,那么这可能导致加拿大PISA成绩出现上升偏差。 其次,由于特殊教育需求等问题,加拿大更有可能将学生排除在参加PISA评估之列(加拿大有7.5%的15岁学生被排除在外,而日本为2.4%,韩国则不到1%)。而这部分被排除在外的学生,很可能是表现较差的群体。 最后,即使是在那些同意参加的学校里,加拿大的学生真正参加PISA评估的可能性也比较低。具体来说,官方数据显示,约有20%的加拿大青少年在PISA测试当天缺席,而日本和韩国的这一比例不到3%。众所周知,某些类型的学生(例如,来自较低社会经济背景的较差学生)在学校的缺勤率较高,而这些特征可能与学生在PISA测试中的表现有关。因此,这似乎有可能导致结果的向上偏差。 总的来说,这是一个严重的问题,我们认为这严重削弱了我们对加拿大2015年PISA数据的信心。我们认为,加拿大在与其他 “表现良好”的国家(如日本和韩国)进行比较时存在特殊的问题,因为这些国家中真正具有代表性的学生参加了测试。 事实上,在刨根问底之后,加拿大成为“教育超级大国”的证据似乎并不特别有力。
Rolf Strietholt, Olesya Gladushyna 和 Andrés Strello 本博文由叶王琼翻译。 全球教育界都在期待着最新PISA排名的公布。这些排名衡量了发达国家和发展中国家15岁学生在阅读、科学和数学方面取得的进步。国际学生评估项目(PISA)作为一种衡量教育质量的方法,它最广为人知的局限性在于,只涵盖了教育体系有限的产出范围。因此,就存在一种威胁,如果各国致力于在PISA测试中取得最大的成绩,那么它们可能会把注意力从教育对更广泛社会的重要(但无法衡量)贡献上转移开,例如,道德和公民参与的发展。事实上,在这篇博客中,我们就各国的PISA成绩和学生的公民知识差异提供了新的证据。 不充分的排名提供了一个支离破碎的画面 要理解为什么PISA提供了一个过于简单的教育质量图景,就有必要重新考虑教育对社会的作用。民主社会普遍的共识是,学校不仅要让孩子为工作做好准备,而且还要促进社会价值观和积极的公民意识。 PISA关注的是教育如何促进经济增长和发展。为此,主办PISA的经合组织测量了被专家认为是人力资本关键的数学、阅读和科学素养。尽管这些学术领域的知识对教育的其他目的很重要,但是积极的公民需要对人权、新闻自由或政党的财政捐助等问题有进一步的了解。在“后真相”时代,激进的民粹主义运动在世界范围内兴起,这种公民教育正成为一个越来越重要的问题。然而,PISA并不能很好地表现这些知识。 比较学生在数学和公民教育方面的表现 然而,在PISA之外,还有其他以衡量孩子的公民知识和态度为中心目标的研究。其中最广为人知的跨国研究就是国际公民与公民教育研究(ICCS)。因此,通过利用PISA和ICCS的数据,我们可以比较不同国家年轻人的学术和公民知识。我们在图1中展示了这样的对比。图1将PISA 2015的数学平均分数(横轴)与ICCS 2016年公民知识测试的平均分数进行了比较。这一比较包括了所有参加这两种评估的欧洲和东亚国家 (拉丁美洲国家被排除在外,因为它们在国际评估中的表现往往较低)。 这一图表清楚地显示,在地理、历史和文化空间相似的国家/地区之间,公民知识存在巨大差异,虽然这些国家/地区的孩子在PISA测试中的分数也相似。例如,香港、韩国和中国台北都是PISA数学成绩最好的地方,但他们在公民知识方面的成绩相差66分(相当于多上一年学)。同样的,虽然丹麦、芬兰、挪威和瑞典的孩子在数学方面达到了国际平均水平,但是他们的公民知识水平非常高。事实上,在这方面,是斯堪的纳维亚(而不是东亚)的儿童领先。 PISA模范生:一个错误的承诺 不同的评估得出不同的教育成绩结论。因此,如果认为一个教育系统的产出(或者任何衡量其 “ 质量” 的尝试)可以被压缩成一个单独的(或者一部分)的分数,那就太天真了。然而,这正是PISA排名经常被解读的方式,对政客和媒体来说尤其如是。因此,在2018年PISA结果即将公布之际,我们敦促读者谨慎行事,并了解标题背后的重要性。特别是,应该避免模仿PISA测试中表现最好的教育体系。相反,值得记住的是,教育系统的产出是多方面的——在一个领域表现出色的国家可能在另一个领域表现不佳。
使用大规模国际教育评估来衡量具体国家或区域政策的效果是一项具有挑战性的任务。这主要是因为,这个目的并不是它们的设计初衷。但是, PISA背景调查问卷中包含的丰富数据有时可以为教育政策的方向提供重要线索。我国一个这样的例子是自1992年以来在加泰罗尼亚实行的语言浸入政策(LIP)。
Rolf V. Olsen 和 Sigrid Blömeke 本博文由叶王琼翻译。 在许多国家,大规模国际评估研究(ILSA)被视为监测教育质量的重要来源。这些研究的结果经常被政策文件引用,并且经常被用作政治辩论中的证据或反驳。因此,在过去20年左右的时间里,ILSA确立了自己作为强大的知识来源的地位。在这四篇系列博文中,我们将介绍和讨论这些研究获得这一地位的两个主要原因:它们支持从两个比较的角度来解释研究结果——教育系统之间的比较和同一系统内的比较。在第四篇也是最后一篇文章中,我们将辨别并讨论这两种比较角度给未来ILSA带来的一些挑战。 量化教育 因为我们试图捕捉的现象是无法直接观察到的,所以很难衡量教育的质量。通常我们感兴趣的是推断人的心理特征——学生在学校学习的积极性如何,教师对工作环境的满意度如何,学生阅读的熟练程度如何,等等。这些属性无法直接观察或测量。我们没有“阅读水平标尺”或者某种即刻报告数值的电子传感器。相反,我们必须依靠间接的方法,使用一个人的一次或(通常)几次的观察值来确定刻度值。幸运的是,实体理论与测试理论(或“心理测量学”)的合作为我们提供了强大的工具,可以为社会和心理领域中的此类现象开发可靠且有效的度量或指标。 然而,即使测量方法在实体理论和心理测量质量上有良好的锚定,数值本身通常也很难解释,例如: •一个系统可以接受的成就水平是多少? •在欺凌等级中,什么值需要我们注意? •什么数值,可以让我们得出结论,比如说,回归系数、相关系数、两组间差异等等,具有实质性意义。 国际比较提供了一个参考框架 对这类问题的回答在很大程度上是规范性的或政治性的,因为我们不仅缺乏推论此类答案的实质性理论,而且我们在规范性上也可能存在分歧。因此,有人可以规定阈值并尝试为其添加含义。 但是,在政治上决定或规定的阈值也需要支持。ILSA通过允许比较,为这种支持提供了几种创建更合理基础的方法。 对比较、标准或规范的选择也不是中立的活动。相反,它构成了对数据进行解释的论证核心或保证。下面的博客文章将讨论与其他国家的比较如何有助于解释来自ILSA的数据,以及为什么这种比较可能具有欺骗性和方法上的缺陷。
Andrés Sandoval-Hernández 国际学生评估项目(PISA)是经济合作与发展组织(OECD)对15岁学生的教育表现进行的一项调查。最新一轮的PISA结果将于今年12月发布,我们将在新闻和其他媒体上看道很多相关报道。有可能大多数报道要么是关于国际排名的,要么是关于“什么在教育中起作用”。但是这些都不是我们应该关注的。 PISA 排名 我们将被告知诸如X国在科学和阅读方面略高于经合组织平均水平,在数学方面也接近经合组织的平均水平。我们将被告知,这一成绩与2015年的成绩相比是否有显著变化。我们还将被告知,X国的表现,比如说,与澳大利亚,德国和爱尔兰等国的表现相当。然后,所有这些排名知识原始分数的比较,它们没有考虑到教育系统运作的社会环境。举个例子,2015年,英国在PISA中的表现明显高于多米尼加共和国(在所有科目上),但是我们也知道英国的人均收入几乎是多米尼加共和国的七倍。因此,当教育系统在如此不同的社会经济条件下运行时,对它们进行原始比较似乎是不公平的(这里有一个考虑到社会经济差异的教育系统之间比较的一个好例子)。 那么,什么在教育中起作用? 关于“什么在教育中起作用”,情况并没有那么不同。教育系统的原始比较也不是很有用,因为PISA可以提供证据支持相互矛盾的主张。学校自治的支持者(即校长和教师在管理学校资源方面拥有更大的自主权)将指出爱沙尼亚(PISA 2015科学排名第3)的情况,声称这是一个很好的做法。另一方面,该政策的批评者会指出新加坡(PISA 2015科学,阅读和数学方面排名第一)的情况正好相反(见PISA 2015结果图II.4.3)。 PISA 2015的结果还可以提供证据,表明在班级较小的学校中,学生的表现往往更好(芬兰的班级平均少于20名学生,科学排名第5),但是他们也可以提供证据来证明相反的结论(日本的班级平均超过35名学生,在科学方面排名第二)(见PISA 2015结果图II.6.16)。 环境很重要 因此,我们应该关注的故事必须超越对教育系统的简单比较。 “我们的排名如何?”或者“什么有用?”,这些不是通过分析PISA所能回答的正确问题。这是因为,如上所示,几乎所有政策都在某个地方奏效,而没有一项政策在所有地方都奏效。这个不是PISA数据的局限,而是我们对它进行的分析和解释有限(除了学生成绩,PISA收集了大量关于学生、教师、学校和国家的背景信息)。 我们的分析不仅要考虑哪些政策或实践有效,还要考虑这些政策或做法可能起作用的条件。 在教育研究中,一切都与环境有关,因此,如果不考虑其所在社会的背景,就无法理解教育系统。
假如你是一位肩负教育体制改革重任的决策者面对令人眼花缭乱并相互竞争的教改提案. 所有提案人都对自己的提案都有百分之百的把握。你是应该听那些提倡推广自由择校的经济学家呢,还是崇拜“芬兰奇迹”, 赶时髦地复制一个几乎和芬兰一样的教育体制?又或许是回到守旧的德国和荷兰教育体制, 把学生分类进行教学?高质量的经验数据大多是地方性的。我们不可能从这些适合于地方性的特定的教育政策中看到其对整个教育体系的影响。因此, 多周期、多国家、高质量的大型国际比较研究, 例如PISA, 可以为决策者提供一个以同样标准比较有不同教育政策的国家的数理和语文的平台。决策者还可以对不同时期的学生成绩进行比较,看看某些新政策的实施对学生的影响。
Cor Sluijter 和 Remco Feskens 本博文由叶王琼翻译。 公平与公正 教育公平在国内外都是一个备受争论的话题。这就导致了一种观点,即教育公平是一个需要采取行动的问题。我们即将发表在《超国家教育政策杂志》(Journal of Supranational Policies of Education)上的文章调查了这种观点是否正确。使用经合组织国际学生评估项目(PISA)的数据,我们调查了整个欧盟的教育“公平”程度。在这种背景下,我们衡量“公平”的方法是考虑各国在PISA考试中的表现,而不受学生背景特征的影响。 欧洲教育体系有多公平? 我们将性别、移民背景、家庭语言、年龄和学生的社会经济状况结合起来,以预测学生在PISA 2015中的科学、数学和阅读方面的分数。 我们假设教育系统越公平,这些背景特征对PISA分数的影响就越小。 Cohen’s f2值0.02、0.15和0.35,分别对应较小、中等和较大的效应。效应值大于欧盟平均值的国家/地区为红色。效果值小于欧盟平均值的国家为绿色。 那么,公平呢? 欧盟的所有背景特征对科学得分的平均影响为0.22,这是一个中等效应。比利时的效应值最大(0.35),其次是法国(0.32)和德国(0.31)。 效应值相对较小的国家包括爱沙尼亚、拉脱维亚、英国和意大利。 在阅读和数学方面,所有背景特征加在一起对PISA分数的平均影响是相当的,分别为中等效应的0.26和0.23。 基于这些结果,我们可以得出结论,在欧洲的教育系统被称为公平之前,还有很长的路要走。 科学、阅读和数学的效应值表明还有很多工作要做。 但是,效应值低于欧盟平均水平的国家若是固步自封,将是愚蠢的。这些国家的效应值远非微不足道。 这项研究的结果明确表明,所有人的机会均等还远未实现。 有关详细信息和结果,请阅读我们上面提到的即将发表的文章(DOI: 10.15366/jospoe)。