Recidivism and Peer Influence with LLM Text Embeddings in Low Security Correctional Facilities
创建于 更新于
摘要
本研究基于大型语言模型(LLM)对低安全级矫正机构中居民间的8万至12万条文本交换进行嵌入分析,发现文本嵌入在预测三年再次犯罪率方面比入职前特征提升了约30%的预测准确度。文中提出基于零样本分类的低维语义类别解释方法,以及新的计量经济学工具以估计多变量同伴效应,解决了多维潜变量、稀疏网络及内生性的挑战。实证发现,行为类文本在居民间存在显著同伴影响,直接影响大于间接影响,为理解社区矫正中语言交互的社会动力机制提供了新视角 [page::0][page::1][page::2][page::3][page::5][page::6][page::23][page::24][page::27][page::29][page::30].
速读内容
研究背景与数据来源 [page::0][page::1][page::4]
- 低安全级别“治疗社区”(Therapeutic Communities, TC)为改善犯罪和药物滥用提供社区支持式矫正。
- 数据来源美国中西部3个TC单元,包含982名女性与1649名男性居民的入退日期及其相互书面正向肯定和纠错的文本交流,总计约20万条消息。
- 入狱后3年重新犯罪率分别为女性22%、男性25%,与国际数据相符。
LLM文本嵌入及零样本分类方法 [page::5][page::6][page::8][page::9][page::10]



- 使用BERT模型提取768维文本嵌入用于数字化表达,构建居民发信和收信的语言行为画像。
- 配合BART模型实现零样本(Zero-Shot)分类,将文本信息映射至“个人成长”、“社区支持”、“规则违反”、“破坏行为”等4个行为类概率指标,提升了可解释性。[page::6][page::7]
- 零样本分类无需标注训练数据,适合本研究中无大量标签文本的场景。
预测模型及性能表现 [page::11][page::22][page::23][page::24][page::25][page::56]

- 采用带惩罚项的LASSO回归和逻辑回归,将文本嵌入和零样本分类概率作为预测因子。
- 文本嵌入显著提升预测准确率:女性单位提升约30%,男性单位提升30.6%。
- 使用零样本分类概率同样表现出显著提升(女性29.7%,男性22%),且提供行为类别的重要性排序。
- “社区支持”相较于“破坏行为”对减少再犯概率具有显著负向边际效应。


网络形成模型与同伴效应估计 [page::12][page::13][page::14][page::15][page::16][page::21][page::25][page::27][page::28][page::29][page::30]

- 为解决网络内生性,提出基于多元变量及多维潜变量的工具变量2SLS估计框架,兼容稀疏多维网络,理论保证估计一致性与渐近正态性。
- 运用随机点积图(RDPG)与潜变量空间模型(LSM)对网络形成建模,结合居民入场时间差等协变量。
- LSM含显式协变量和多维潜变量,拟合效果优于只用单一潜变量的模型,能更好复刻网络模组度、行均值方差和聚类系数。
- 同伴效应模型中,用户发信与收信文本类别的直接同伴影响显著,间接影响较小;社区支持类和个人成长类存在积极同伴溢出效应。
- 校正潜在异质性后,估计更稳健,同伴影响关系更明确。
- 使用算法1(光谱嵌入+非参数筛法)实现参数估计。
- 模拟结果显示,模型在多种网络结构和样本量设置下均有良好性能表现。
- 数值模拟中,随着样本量增大,估计均方误差显著下降。
研究贡献与启示 [page::30]
- 利用LLM文本嵌入及零样本分类深化了矫正机构内部语言交流在预测犯罪再犯中的应用。
- 本文创新集成了先进文本分析技术与计量经济学网络内生性校正方法,扩展了同伴效应多变量及稀疏网络场景下的理论框架。
- 研究揭示语言行为的同伴传播效应,在社区矫正设计与风险评估中具重要参考价值。
- 支持采用以社区支持和个人成长为核心的文本行为干预策略以降低再犯风险。
深度阅读
金融研究报告详尽分析报告
1. 元数据与报告概览
- 报告标题:Recidivism and Peer Influence with LLM Text Embeddings in Low Security Correctional Facilities
- 作者及机构:Shanjukta Nath(乔治亚大学农业与应用经济系)、Jiwon Hong、Jae Ho Chang、Keith Warren(俄亥俄州立大学统计系及社会工作学院)、Subhadeep Paul(俄亥俄州立大学统计系)
- 发布日期:2025年9月26日
- 主题:探讨基于大规模语言模型(LLM)文本嵌入的囚犯再犯率预测及同伴影响机制,特别聚焦于美国中西部低安全级别的治疗社区(Therapeutic Communities,TC)。
报告核心论点:
本文创新性地运用预训练Transformer大语言模型(LLM)生成的文本嵌入向量,对低安全级别矫正设施中囚犯之间数十万条书面确认和纠正文本互动进行了分析。结果表明,基于文本的特征(嵌入向量)在预测三年再犯率上的性能显著优于仅使用入所前传统变量,准确率提升约30%。为克服高维嵌入的可解释性困难,本文采用Zero-Shot分类方法将文本高维向量映射至低维用户定义类别,实现解释性预测。进而,报告提出了创新的多变量同伴效应估计方法,控制网络内生性,适应稀疏网络、多维潜变量和相关多变量结果,并发现语言使用存在显著同伴效应。
---
2. 逐节深度解读
2.1 摘要与引言(Abstract & Introduction)
- 关键论点:
- 大量介入文本(8-12万条)经由Transformer模型产生的语言嵌入相较于传统的入所前变量,在再犯率预测中的准确度提升约30%(AUC从约0.5提升到0.7)。
- 利用Zero-Shot方法实现可解释文本分类,结合多变量同伴效应模型分析同伴影响,控制网络内生性。
- 背景阐述:
- 全球再犯率高达18%-55%,监狱人口约1100万,经济社会成本巨大。
- 现有监狱干预以心理社会干预为主,尤其是治疗社区(TC)模式,强调同伴互动、正向反馈与行为纠正。
- 对传统预测算法(如COMPAS)准确率的质疑及其与非专业人员预测相近的事实。
- 数据与动机:
- 三个中西部州的三个治疗社区单位,含录入退出时间、个体入所变量及全部互动文本记录。
- 利用文本互动特征,建立新型预测模型以提升再犯预测及理解行为形成机制。
2.2 治疗社区背景和数据(Section 2 Empirical Setup)
- 数据样本:
- 两个男性单元和一个女性单元,总计分析居民人数2631人,均为最低安全级别矫正社区。
- 居民平均停留时间约120天,最高可达180天,毕业率分别约87%-89%。
- 再犯定义:
- 通过州矫正部门行政数据追踪毕业居民三年内再入狱情况,再犯率约22%-25%,符合国际统计水平。
- 文本数据特点:
- 包括时间戳、发送者ID、接收者ID及确认/纠正文本内容。
- 女性单元约12.3万条互动,男性单元8.3万条。
- Affirmations(正向反馈,push)和Corrections(纠正,pull)的发送、接收数量分布存在性别差异。
- 文本内容示例:
- 图1(时间线图)展示个别居民入所退出及互动时间点,反映时间上的互动动态与文本交流。
2.3 语言模型与文本表示方法(Sections 3.1及3.2)
- 文本嵌入:
- 采用BERT(bert-base-uncased)模型获得768维的上下文感知嵌入。
- 消息级嵌入通过平均消息内各token嵌入获得,进一步计算发送者和接收者的个人嵌入档案。
- 嵌入反映个体行为模式(发送者反映互动态度,接收者反映被认知行为)。
- Zero-Shot分类:
- 利用BART大型模型在MNLI任务基础上实现,无需训练数据、基于语言蕴涵推断对文本赋予类别概率。
- 用户定义类别选取四个:个人成长(Personal Growth)、社区支持(Community Support)、规则违规(Rule Violations)和扰乱行为(Disruptive Conduct)。
- 通过概率值进行可解释性建模,保持嵌入的预测性能。
- 高维模型预测:
- 对高维嵌入与传统变量采用Logistic LASSO回归,参数调节通过交叉验证,预测效果评估采用五折交叉拟合外样本AUC。
2.4 同伴效应模型及网络模型(Section 3.4及3.6)
- 多变量同伴效应模型:
- 设$Y{N \times m}$为多维结果矩阵,$G$为行归一化后邻接矩阵,模型表示为$Y=GYD + XB1 + GXB2 + E$。
- $D$矩阵对角反映同一维度直接同伴溢出,非对角反映不同维度间间接溢出。
- 网络内生性问题:
- 网络的生成与结果中的误差项由潜在变量$U$驱动造成内生性。
- 引入潜变量模型$A{ij}=f(Ui,Uj,\xi{ij})$,通过非参数工具函数及机器学习方法估计调整。
- 估计策略:
- 利用带条件期望调整的IV 2SLS方法,构造工具变量包含$X$, $GX$, $G^2 X$。
- 潜变量通过随机点积图模型(RDPG)或潜空间模型(LSM)估计,并用张量积基函数做非参数估计。
- 网络模型:
- RDPG模型:节点潜变量内积定义边概率,适用于稀疏网络,估计方法为谱嵌入。
- LSM模型:允许多维潜变量及协变量影响,最大似然估计,捕捉更复杂网络结构。
- 理论保证:
- 估计量在网络规模增大时满足$\sqrt{N}$一致性和渐近正态分布,适用于稀疏网络。
- 理论结果突破传统需“密集网络”假设的限制,现实适用性高。
2.5 模拟验证(Section 4)
- 执行两种网络数据生成模型(RDPG和带协变量的LSM),对比不同调整方法下的参数估计均方误差(MSE)。
- 结果显示,随着样本规模增加,提出方法能显著降低MSE,准确恢复直接及间接同伴效应。
- LSM模拟结果MSE普遍较RDPG大,但现象一致,均支持方法有效性。
2.6 预测再犯结果(Section 5.1)
- 嵌入向量模型:
- 五折交叉拟合显示加入文本嵌入后的受试者工作特征曲线(ROC)AUC相比仅用传统变量提升约30%(女性单元从0.53到0.70,男性类似)。
- LASSO算法从768维嵌入中选择出约26-37个重要特征,说明嵌入有效稀疏特征提取。
- Zero-Shot类别概率模型:
- 类别概率作为变量的逻辑回归,经过ALR转换(扰乱行为为基准),同样获得近30%的预测提升。
- 变量重要性分析表明,社区支持类别概率对降低再犯概率具有显著贡献。
- 聚合方式:
- 无论文本嵌入和类别概率是按发送者还是接收者聚合,预测效果均有较大提升,强调访客间互动语言的重要信息。
2.7 网络模型拟合分析(Section 5.2)
- 网络结构比较:
- 以模块度、行均值标准差、三元闭包率为标准,比较5种网络模型生成的网络性能。
- 含乘法和加法潜变量且包含协变量(进入日期接近度)的潜空间模型(lsm-cov)表现最佳,能较好重现网络真实结构。
- 入所时间接近性被确认为影响消息互动网络形成的关键协变量。
2.8 同伴效应估计结果(Section 5.3)
- 估计体系:
- 基于潜空间模型和IV 2SLS方法,考虑网络内生性调整。
- 估计采用基于Zero-Shot分类结果的四个行为类别概率(ALR转换)。
- 女性单元:
- 发件人视角下,三类别与扰乱行为均显著存在正向直接同伴溢出,且个人成长、社区支持对规则违规表现间接影响。
- 收件人视角下,个人成长和规则违规仍显著,中间存在一定的负向间接影响。
- 男性单元:
- 发件人视角下,社区支持和规则违规类别存在显著正溢出,其他间接效应不显著。
- 收件人视角下,个人成长和规则违规的直接效应显著,间接效应较弱。
- 总结:
- 同伴影响存在且直接影响大于间接影响,校正潜变量后估计精度提升,显示同伴语言互动对行为形成至关重要。
2.9 结论(Section 6)
- 本文首次将Transformer大语言模型应用于矫正设施内居民语言交流文本的嵌入提取,显著提升了再犯率的预测性能。
- 通过Zero-Shot分类赋予文本可解释的心理行为类别,揭示社区内的同伴效应和行为动力机制。
- 开发的多维潜变量网络内生性调整IV估计方法适用稀疏网络和多变量结果,拓宽了同伴效应研究方法的边界。
- 预测及机制分析均支持治疗社区通过同伴交流增强行为矫正效果的理论机理。
---
3. 图表深度解读
3.1 图1:居民入住时间线及消息交换示例(Page 5)
- 描述4名居民在2006年的入所日期与退出日期,并标示了确认和纠正消息交互的时间点。
- 该图展示了消息“推”( affirmations)和“拉”(corrections)发生的具体时间,反映消息传播的时序特征。
- 支持了文本数据的时序特性和网络形成的真实性,强调了时间重叠对消息交换的现实限制。
3.2 图2:Zero-Shot分类示例(Page 6)
- 左侧为原始消息文本,右侧展示对应四类标签的概率分布。
- 激活标签用红色高亮,表明消息文本与对应类别存在高度关联。
- 例如,“holding family hostage”被判定主要含有扰乱行为成分(概率0.79);“getting promotion”则对应个人成长(概率0.84)。
- 直观展示Zero-Shot方法在无监督且无标签条件下识别心理行为类别的有效性。
3.3 图3及B4:分类概率与消息类型散点图(Page 7 & 55)
- 以散点图展示五折抽样文本中,每条消息的四个类别概率的两两关系,青色点表示affirmations(推),红色点表示corrections(拉)。
- 结果展示类别间尖锐的负相关关系,如“个人成长”与“扰乱行为”成反比,区分了不同消息的行为特征。
- affirmations更偏向个人成长与社区支持类别,corrections更集中于规则违规与扰乱行为类别,符合实际的行为反映。
3.4 图4:Zero-Shot分类流程示意(Page 10)
- 以流程图形式描述文本消息与用户定义的假设标签拼接进入BART模型编码,经过线性变换和softmax得到各类别的蕴涵概率。
- 清晰展示了Zero-Shot分类将文本映射到用户类别的内在机制,即语言蕴涵推断。
3.5 图5及B6:预测再犯ROC曲线(Page 23, 56)
- 通过ROC曲线比较仅用传统入所变量与加入LLM嵌入向量后的再犯预测性能。
- 女性单元AUC从约0.53提升至约0.70,男性单元类似提升幅度。
- 图表证明基于文本数据提取的行为特征对再犯风险预测的显著提升。
3.6 图6及B7:Zero-Shot类别概率模型预测AUC(Page 25, 57)
- 基于四个心理行为类别的概率的逻辑回归模型,AUC提升幅度约为女性单元29.7%,男性22%。
- 进一步验证了低维、可解释行为类别的预测有效性。
3.7 图7:变量重要性及社区支持边际效应(Page 26)
- 变量重要性通过McFadden伪$R^2$的减少量评估,社区支持ALR的剔除导致最大性能下降,说明其在再犯预测中的核心地位。
- 边际效应曲线显示,社区支持相较扰乱行为的比例提升显著降低再犯概率,效果男女均明显,且具有非线性特征。
3.8 图8:网络结构统计指标比较(Page 27)
- 比较不同网络模型对三项真实网络结构指标(模块度、行均值标准差、聚类系数)的拟合分布。
- 潜空间含协变量模型(lsmcov)在男性单元网络各项指标中表现最佳,在女性单元也表现优异,说明其能较精准模拟现实网络形成。
- 其他模型如tetra-logit、RDPG表现逊色,凸显潜变量多维模型的优势。
---
4. 估值分析
本报告非典型的金融估值报告,主要从统计建模和预测技术角度展开,未涉及企业估值方法如DCF、PE等财务指标估算。因此本报告不包含传统意义上的估值分析,而是重点在:
- 预测准确率指标(如AUC、误差率)衡量模型性能。
- 模型参数显著性与效应大小,比如同伴效应矩阵的直接与间接效果大小。
- 网络模型拟合优度,通过模块度、聚类系数等指标衡量。
---
5. 风险因素评估
报告未明列具体风险因素,但隐含可识别以下潜在风险点:
- 网络数据内生性风险:未调整潜变量即会导致同伴效应参数估计偏差。
- 模型假设风险:包括潜变量模型及非参数函数拟合假设、网络模型稀疏性、样本同质性假设。
- 数据质量风险:文本数据异质性,语言模型对不同文本的解析力、Zero-Shot分类的准确度限制。
- 外推风险:该中西部三治疗社区数据和模型,在其他地理或不同安全等级监管环境下适用性尚不确定。
缓解策略:
- 通过潜变量估计和非参数投影缓解因未观测同伴异质性导致的内生性偏差。
- 使用交叉验证和模拟实验验证模型稳健性与泛化能力。
---
6. 审慎视角与细微差别
- 文本嵌入和Zero-Shot技术尽管提升预测性能,但基于语言模型的黑箱特性存在一定解释局限,可解释性依赖于用户定义类别的合理性和语言模型训练数据的适用范围。
- 潜变量模型假设社区网络归结于少数维度的潜在特征,可能忽略更复杂的社会行为机制,模型拟合虽优但毕竟是简化。
- 同伴效应估计区分直接与间接影响,但间接影响估计标准误较大,实际应用中需谨慎解释。
- 预测模型准确率虽有提升,但AUC仍未达到极高水平,受限于入所前变量及文本数据可捕获信息的限制。
---
7. 结论性综合
本报告通过数理统计与机器学习前沿方法,实现如下关键成果:
- 基于近百万条监督文本写作,利用预训练大语言模型构建高维语义嵌入,显著提升低安全级别矫正社区居民3年再犯预测准确率,提升幅度约30%。
- 引入Zero-Shot分类技术,将文本嵌入映射为四个心理学类别(个人成长、社区支持、规则违规、扰乱行为)的概率分布,提供可解释的行为指标,同时几乎不损失预测性能。
- 开发了适用于多维度同伴效应估计的IV 2SLS框架,控制网络潜变量驱动的内生性,适用多输出、多维潜变量且支持现实中稀疏网络,算力和理论保证兼备。
- 同伴效应估计表明,居民间的语言表达存在强烈社会影响(直接影响明显大于间接影响),社区支持类信息的增多显著降低再犯概率,体现治疗社区互助交流的核心作用。
- 潜空间网络模型结合协变量与多潜变量结构,在拟合实际消息交互网络结构特征方面表现优越,验证了网络生成过程的潜变量假设。
此次研究不仅技术突破了文本语义分析与网络内生性估计的瓶颈,同时为司法矫正领域的风险评估和行为机制提供了科学依据和新的预测工具。整体来看,本报告结合先进AI技术与经济计量理论,展现了跨学科研究对社会问题解决的巨大潜力与现实价值。[page::0,page::1,page::2,page::3,page::4,page::5,page::6,page::7,page::8,page::9,page::10,page::11,page::12,page::13,page::14,page::15,page::16,page::17,page::18,page::19,page::20,page::21,page::22,page::23,page::24,page::25,page::26,page::27,page::28,page::29,page::30,page::31,page::32,page::33,page::34,page::35,page::36,page::37,page::38,page::39,page::40,page::41,page::42,page::43,page::44,page::45,page::46,page::47,page::48,page::49,page::50,page::51,page::52,page::53,page::54,page::55,page::56,page::57]