DETERMINANTS OF LATIN AMERICAN STUDENTS ACADEMIC RESILIENCE—INSIGHTS BASED ON PISA 2022 USING AN EXPLAINABLE MACHINE LEARNING APPROACH
创建于 更新于
摘要
本研究基于PISA 2022数据和拉丁美洲9国样本,采用解释性机器学习(SHAP方法)分析学业韧性学生(即弱势背景下表现优良学生)的主要决定因素。结果显示,家庭数字设备和书籍、性别、作业和学习重复等学生层面指标,以及学校规模、师生比、教师资质和疫情期间学校关闭时长等学校层面因素,对学业韧性影响显著。研究揭示疫情闭校和远程学习障碍负面影响,强调不同学业韧性定义下驱动因素差异,区分私立与公立、城乡学校的决定因素特点,为区域教育公平与政策制定提供科学依据 [page::0][page::1][page::6][page::7][page::10]
速读内容
研究背景与定义 [page::0][page::1][page::2]
- 拉美地区学生学业韧性(Academic Resilience)指来自弱势家庭背景但学业表现达到基线水平(PISA水平2)的学生群体。
- 研究采用四种学业韧性定义指标(SAR1~SAR4),涵盖不同严苛程度的学业韧性识别标准。
- 聚焦拉美9国PISA 2022数据,分析最弱势40%的学生群体,提高研究针对性与实用性。
数据与变量概述 [page::3][page::4]
- 样本涵盖约1.7万名学生,包含学生、家庭、学校特征及COVID-19相关变量。
- 学生变量包括数字设备数量、图书数量、作业量、重复学习、个性特征(好奇心、毅力等)。
- 学校变量涵盖学校规模、师生比、互联网接入率、教师资质等,疫情变量包含闭校天数及远程学习障碍。
机器学习模型比较与选择 [page::4][page::24]
- 采用Logistic回归、神经网络、梯度提升树(GBT)三类模型进行预测。
- GBT模型在AUROC及AUPRC指标上均显著优于其它模型,成为主用模型。
重要决定因素SHAP值分析 [page::6][page::15][page::16]


- SAR1(基于简单水平2阈值)受学生个人特征影响最大,主要为数字设备数、性别(男有优势)、作业时间、生命满意度、重复率及工作强度。
- SAR2(控制SES及学校效应的概率模型)则更多源于学校层面,如学校中弱势学生比例、学校规模、师生比、互联网接入率、教师资质及家长教育水平。
- 疫情相关变量显示闭校天数延长和远程学习障碍加剧均降低学业韧性概率。
疫情变量与个性特征的边际效应 [page::7][page::18]


- 闭校天数从230天增加到400天,学业韧性概率降低10%-25%。
- 学生好奇心与毅力指数提升显著提高韧性概率,特别是好奇心表现出10%左右正面效应。
子样本(私立/公立,城乡)分析差异 [page::8][page::19]

- 私校学生韧性驱动以数字资源和家庭文化资本为主,公校学生则更依赖基础教育质量及教学支持。
- 城乡学生在影响因素上出现分化,乡村学生的家庭教育水平和教学质量变量尤为重要。
局部解释——极端学生案例分析 [page::9][page::20]

- 高韧性学生特征:私校就读、丰富数字设备和书籍资源、作业投入多、未重复学业、性格积极、满意度较高。所就读学校教师资质高且远程教学普及。
- 低韧性学生特征:重复学业、负面人格特质如低好奇心和同理心、作业少、家庭教育水准低、疫情闭校时间长、资源缺乏。
深度阅读
金融研究报告详尽分析报告
---
一、元数据与概览
报告标题:
DETERMINANTS OF LATIN AMERICAN STUDENTS ACADEMIC RESILIENCE—INSIGHTS BASED ON PISA 2022 USING AN EXPLAINABLE MACHINE LEARNING APPROACH
作者:
Marcos Delprato,隶属于阿根廷Chilecito国立大学教育研究所
发布时间/数据来源:
基于2022年PISA数据,涵盖拉丁美洲9个国家
主题:
聚焦拉美地区学生学业韧性(Academic Resilience),即来自经济文化劣势背景但学业表现优异的学生,运用可解释机器学习方法(SHAP)探讨该地区学业韧性的驅动因素。
核心论点:
- 拉美地区学业表现存在严重的“学习危机”,后疫情时期更因教育不平等加剧问题。
- 学业韧性学生是指那些即使面对劣势背景,依然取得较好成绩的学生,研究其驅动因素对政策设计极具价值。
- 通过SHAP解释型机器学习方法,分析家庭投入、性别、作业、复读、工作强度、学校规模、师资质量、疫情相关因素等对学业韧性的不同影响。
- 不同学业韧性指标对应不同的主要影响因素,且疫情中学校关闭时间及远程学习障碍对学业韧性产生负面影响。
报告旨在为拉美地区制定定向教育政策、提升劣势学生学业表现提供数据支持和政策建议。[page::0,1]
---
二、逐节深度解读
2.1 引言与背景(Introduction & Background)
- 学习危机背景:
疫情使拉美及加勒比地区学习危机加剧。该地区学校停课时间长(约270天,相当于1.42年教学时间损失),尤其劣势学生受影响巨大。收入最低10%学生丧失教育时间是顶层学生的4倍(81% vs 22%)[page::0]。
- 学业韧性(SAR)的定义及意义:
学业韧性指即使家庭经济、社会文化地位较低,学生依然取得良好学业成绩的能力。研究SAR帮助发现拉美教育不平等的逆转路径,支持提升劣势群体社会流动性[page::0]。
- 文献缺口与论文贡献:
现有学术多不聚焦拉美地区,且学业韧性定义多样。本文创新点在于:
- 采用4种不同学业韧性定义,综合考虑三科(数学、阅读、科学)共性表现
- 利用2022年PISA最新数据,涵盖9国样本
- 应用最新的机器学习解释技术(SHAP),探究不同教育子系统(公/私校,城乡)差异
- 结合疫情背景变量分析疫情影响[page::1,2]
2.2 学业韧性的测量(Working Definitions)
- 学业好表现界定:
采用PISA中Level 2作为基础绩效线(较适合拉美局势),学生达不到为“低绩效”[page::2]。
- 经济文化地位筛选:
聚焦经济社会文化地位(ESCS指数)处于底部两分位数(40%以下)的学生群体[page::2]。
- 四个SAR定义指标:
- SAR1:家庭ESCS处于40%以下且数学、阅读、科学均达到Level 2标准(最广泛采用)[page::2]。
- SAR3:SAR1基础上,更限定于来自学校学业与家庭SES差距较大(不平等性高)的学生群体[page::3]。
- SAR2:多层逻辑回归模型(学生嵌套于学校,学校嵌套于国家)预测学生达到Level 2的概率,概率最高40%学生视为韧性群体[page::3]。
- SAR4:SAR2基础上,剔除来自最优学校(随机截距最高20%)的学生,使韧性定义更严格[page::3]。
该设计多角度捕获学业韧性,兼顾学生个体及学校环境的多重影响[page::2,3]。
3 数据及描述统计
- 样本:
使用2022年PISA数据,9个拉美国家(阿根廷、巴西、智利、哥伦比亚、多米尼加共和国、墨西哥、巴拿马、秘鲁、乌拉圭)[page::3]。
- 数据摘要:
- SAR整体率差异显著,SAR1覆盖21.2%的20%最贫穷学生,SAR3更严格仅11.2%[page::3]。
- 私立学校与城市学校的学业韧性比例远高于公立及农村学校,私校公校差达到11%-25%,城乡差异5%-12%[page::3]。
- 统计对比表显示,韧性学生通常男性更多,作业量多,家中拥有更多数字设备和书籍,重复率更低,作业完成情况更好,父母教育程度高,较少从事有偿工作,且个性(如好奇心、同理心等)更积极[page::3-4]。
- 疫情变量:
学校较短停课时长、远程学习比例高,以及远程学习硬件和制度障碍少,均正向关联学业韧性[page::4]。
4 方法论
- 机器学习模型对比:
采用逻辑回归(Logit)、神经网络(NN)、梯度提升树(GBT),使用5折交叉验证、超参数网格搜索[page::4]。
- 模型表现:
以AUROC和AUPRC评分指标,GBT显著优于其他模型,适合捕捉复杂非线性关系和变量交互,最终模型为基于XGBoost库的GBT实现[page::4,24]。
- GBT模型简介与正则化目标函数:
GBT为多个树模型的加法组合,目标函数结合预测误差与正则项,防止过拟合[page::5]。
- 解释方法—SHAP算法:
引入Shapley值,此为博弈论中用于分配“贡献值”的指标,用于解读ML黑盒对单个预测的变量贡献,实现局部与全局可解释性[page::5,6]。
- 部分依赖图:
对关键变量展示预测输出的边际影响(相对概率),辅助解读疫情和软性技能对学业韧性的具体影响[page::6]。
5 结果
5.1 整体样本估计
- 5.1.1 主要驱动因素(Fig.1 & Fig.2)
- SAR1指标(基于基础水平2)主要由学生及家庭层面变量决定,前25个重要变量中,数字设备、性别(男生更韧性)、作业时间、生活满意度及复读情况最具解释力,个性特质亦有影响,学校类型(私立)和疫情相关变量次之[page::6,15,16]。
- SAR2指标(基于预测概率并控制SES)影响因素明显转向学校层面,最关键的是学校内劣势学生比例、学校规模、联网电脑比例、师生比、教师资质和家长教育,疫情障碍变量依然重要。这突出不同韧性定义对驱动因素的敏感性[page::6,15,16]。
- SAR3与SAR4(更严格定义)进一步强调学校特征或家庭投资的角色,具体表现为韧性驱动因素的动态转换[page::6,15]。
- Beeswarm图揭示:数字设备多显著正向影响;男性倾向韧性;复读显著降低韧性概率;付费工作过多负向影响韧性;私校学生显著高韧性;学校师生比、教师认证率高等变量均正向贡献[page::6,16]。
- 5.1.2 疫情相关背景变量(Fig.3)
- 学校停课天数越长,韧性出现概率越低,举例:停课天数从230天增加至400天,韧性概率下降10%-25%。
- 远程学习比例越高,韧性概率显著提升。
- 远程学习的各种障碍(系统、技术、网络)越多,韧性概率越低,凸显疫情对教育不平等的负面影响[page::7,17]。
- 5.1.3 软性人格特质(Fig.4)
- 好奇心和毅力是促进学业韧性的保护性软技能,拥有较高指数的学生韧性概率提升10%(主要在SAR1和SAR3指标),毅力的提升同样增加韧性概率。
- 软性技能对严格韧性指标影响相对较小,但仍为积极因素[page::8,18]。
5.2 分子样本估计(按学校类型与位置,Fig.5)
- 私校与公校模型中,SAR1相关变量排名相关度高(Spearman系数0.648,显著);但SAR2模型中相关性较低(0.32,非显著)。
- 公校群体中,性别和复读排名权重上升,某些学生和学校变量(如学生自信心、联网电脑比例、教师认证)重要性增加。
- 私校样本中,父母教育、教师专业发展参与率、远程学习相关障碍更重要[page::8,19]。
- 城乡分析显示,城市学员中复读和数字设备重要性略高,农村学员中性别及家庭作业参与度更关键,教学质量和远程学习障碍影响更显著。
- SAR2模型中,农村学生父母教育和教师专业发展表现出更高的韧性预测力[page::8,19]。
5.3 局部解释—极端样本学生(Fig.6)
- SAR1中学业韧性最高的学生特点:
- 私校就读,家中有约26至100本书、10台数字设备
- 作业量大(每周3-4小时)
- 性别为男性,生活满意度高
- 不曾复读,呈现积极同理心特质
- 学校师资力量强(认证率83.3%。教师专业发展70%)
- 参与远程学习学生比例高[page::9,20]
- 学业韧性最低学生:
- 复读经历,个性指标(好奇心、同理心、压力管理)负向
- 作业量少(30分钟以内)
- 设备少,父母教育程度低[page::9,20]
- SAR2顶尖学生:
- 学校劣势学生比例低(20%)
- 师生比高,母亲教育水平较高
- 数字设备丰富
- 高生活满意度和作业投入[page::9,20]
- SAR2最差学生:
- 学校劣势学生比例极高,师资和设备条件恶劣
- 父母教育未完成小学
- 学校停课时间较长(300天vs 240天)[page::9,20]
---
三、图表深度解读
图表1(Figure 1)— 主要驱动因素SHAP重要性排序
- 描述:
展示前25位变量按平均绝对SHAP值排序,分别对应4种SAR指标(SAR1至SAR4)(图15页)[page::15]。
- 解读趋势:
SAR1以学生个人因素为主,如数字设备、性别、作业和重复情况。SAR2则以学校相关因素为主,如学校劣势学生比例、学校规模及师资等。SAR3、SAR4作为更加严格定义,显示学业韧性驱动因素在学生与学校间随着定义变化有所变动[page::6,15]。
- 文本联系:
支持文本中强调的不同SAR定义对应不同影响构成,体现学业韧性的多层次性和复杂性[page::6]。
图表2(Figure 2)— Beeswarm点图展示单一变量SHAP值分布
- 描述:
展示每个学生对应变量的SHAP值分布,可直观看出变量的正负效应和个体异质性[page::16]。
- 趋势:
- 数字设备多为正贡献,高SHAP值聚集红色;数字设备少为负贡献,蓝色点。
- 男性变量显著正向影响韧性(红色集中在正区间)[page::16]。
- 复读负效应明显(低SHAP值蓝点)。
- 私立学校因变量呈现较高SHAP值,表明私校有优势[page::16]。
- 联系:
为之前重要性图提供个体层面佐证,显示变量影响在全样本中分布广泛,非集中在少数个体[page::16]。
图表3(Figure 3)— 疫情变量部分依赖图
- 描述:
展示疫情变量如停课天数、远程学习比例、网络和系统障碍对韧性概率的边际效应[page::17]。
- 趋势:
- 学校停课天数增加,韧性概率明显下降(OR下降10%-25%)。
- 远程学习比例提升,韧性概率上升,标志远程教学在保障学业稳定中的重要作用。
- 远程学习障碍越大,韧性概率越低,体现技术和制度壁垒加剧教育不平等[page::7,17]。
- 联系:
呼应报告中关于疫情对拉美学习危机加剧的论述,指出教育政策应重视缩短停课与提升远程学习接入[page::6,7]。
图表4(Figure 4)— 软性技能部分依赖图
- 描述:
分别展示好奇心和毅力两大软性人格指标对学业韧性概率的影响[page::18]。
- 趋势:
- 好奇心指数越高,韧性概率越大,最高可增10%概率。
- 毅力表现同样呈正相关,虽力度小于好奇心[page::8,18]。
- 联系:
突出软技能对教育公平和韧性的重要价值,教育政策可考虑软技能培养[page::8]。
图表5(Figure 5)— 分子样本驱动因素比较(私立vs公立,城乡)
- 描述:
私立和公立学校,以及城乡学校内韧性驱动变量的排名比较。图中用线连结表示变量排名变化[page::19]。
- 解读:
- 私立学校更强调家庭教育投资与数字资源,公立学校学生个人特质如性别、复读、学生自信更显重要。
- 城乡学校驱动因素差异显著,城乡背景决定了韧性培育的侧重点[page::8,19]。
- 联系:
展示教育系统内部不均衡,强化“按需施策”的必要[page::8]。
图表6(Figure 6)— 极端学生个案SHAP贡献剖析
- 描述:
针对韧性概率最高和最低学生展示10个最关键变量及其具体指标值的SHAP贡献[page::20]。
- 解读:
极韧学生具有私校背景、丰富家庭资源及良好个性特质,参与度高;非韧学生则复读、资源贫乏且个性问题突出,疫情不利因素更明显[page::9,20]。
- 联系文本:
具体示例直观体现模型发现,具备现实指导意义,有助政策精准干预[page::9]。
---
四、估值分析
本报告不涉及企业或财务估值,故无相关估值分析部分。
---
五、风险因素评估
- 报告指出模型结果为相关性分析,非因果推断,存在潜在交叉影响和未观察因素的风险。
- SHAP解释法虽具备可解释性,但也有学术争议,可能存在解释偏差。
- 学校效应、区域差异及疫情变量带来的风险仍需谨慎解读。
- 缺乏因果设计限制了政策的直接应用转化,未来研究需加强方法论完善及动态分析[page::10]。
---
六、批判性视角与细微差别
- 潜在偏见:
- 依赖横截面PISA数据,忽略时间动态变化。
- 优先选择四种SAR定义,是否涵盖全部韧性维度存疑。
- 疫情数据可能受地区报告准确性限制,远程学习障碍变量构造具争议。
- 数据限制:
- 某些细节数据(如软技能)仅覆盖部分国家,导致样本选择偏差。
- 未详细讨论多变量间的复杂交互效应,模型可能未完全捕捉社会经济结构的多层影响。
- 报告内部一致性:
- 各变量重要性随SAR定义变化明显,反映学业韧性定义的内在复杂和测量挑战。
- 子群体分析支持整体结论,增强了报告可靠性。
---
七、结论性综合
本文基于2022年PISA数据,利用先进的解释型机器学习方法(GBT与SHAP)深入分析了拉美地区学生学业韧性的决定因素。通过四种不同定义的韧性指标,明确了家中数字设备、家庭阅读资源、学生性别及作业投入为学生个体层面最重要的影响因素;而校方层面则强调师资质量(认证教师比例、教师专业发展)、学校规模、联网电脑比例及师生比。疫情相关变量(停课时长和远程学习阻碍)对学业韧性有显著负面影响。
不同韧性指标中的变量重要性差异凸显学业韧性测度的本质复杂性,而私立与公立、城市与农村学校之间的差异展现拉美教育系统的内部分化和不平等。局部分析揭示极端学生学业韧性差异具体表现于家庭资源、学校资源和个人特质的结合。
全部分析为政策制定提供了精确的变量靶向,支持构建有利于提升弱势学生学业表现的教育策略,特别是在疫情后重建阶段具有重要现实意义。报告强调,缩短学校停课时间、改善远程学习条件、加强师资专业发展和家庭教育支持,是提升学业韧性必不可少的手段。尽管存在因果解释的局限,该研究为拉美教育公平和社会流动性的促进提供了不可或缺的实证依据和理论视角。[page::0-10,15-20]
---
综述
该研究通过细致的数据分析和多维度解释方法,科学刻画了拉美学业韧性的复杂驱动结构,创新采用了机器学习下的可解释AI方法突破传统研究局限。结合疫情影响,强调了学业韧性提升对抗教育不平等的重要性。报告结构严谨、视角全面,学理与政策衔接紧密,是拉美教育研究领域的创新力作。
---
注: 附录中表格详细列出变量定义及模型搜索参数,图集丰富展示了模型表现与变量关联,为深度再现和政策应用奠定坚实基础。[page::11,25-32]