`

What influenced the lack of diversity in CSR after the company’s losses: evidence from topic modeling

创建于 更新于

摘要

本文基于中国A股企业2006-2023年CSR报告,运用LDA主题模型及Gini-辛普森指数与Shannon熵衡量CSR披露的主题多样性。研究发现,企业亏损显著压缩CSR主题多样性,符合“松弛资源假说”;同时,媒体关注度、管理层薪酬激励及监事会持股比例等内外部治理机制缓解该负面影响。异质性分析显示,第三方保障报告、关注安全内容、大型企业及竞争较弱行业中该效应减弱。这为理解财务困境对非财务披露结构性影响提供新视角,并对企业责任沟通优化、评级机构指标完善及监管政策设计具有指导意义[page::0][page::3][page::4][page::6][page::8][page::10][page::11][page::12][page::15][page::16][page::17]

速读内容


研究背景与意义 [page::1][page::2]

  • CSR披露多样性反映企业社会责任的广度与韧性,是企业透明度的重要维度。

- 中国自2006年起CSR逐步制度化,迫切需要量化分析企业能源与社会治理信息披露结构。
  • 采用LDA主题模型避免词典构建主观偏差,提高主题捕获的通用性和准确性。


量化方法与指标定义 [page::6][page::7][page::8]

  • LDA模型提取 CSR 报告文本中的潜在主题分布。

- CSR主题多样性采用Gini-Simpson指数和Shannon熵衡量,分别反映主题分布的不平等程度和信息熵。
  • 年度箱线图显示指标呈类似趋势,验证多样性度量的稳定性。





亏损对CSR多样性负面影响的实证检验 [page::10][page::21]

  • 基线回归显示亏损显著降低CSR主题多样性,支持“松弛资源假说”。

- 控制了公司规模、杠杆率、经营现金流等关键变量,稳健性高。
| 变量 | 系数 (CSRDivgini) | 系数 (CSRDivent) | 显著性 |
|-------|-----------------|-----------------|--------|
| 亏损 (Loss) | -0.0174 | -0.0427 | * |

媒体关注的调节效应 [page::10][page::22]

  • 媒体关注度(正面、中性、负面新闻量)均能缓解亏损对CSR多样性的抑制,负面新闻调节效应最强。

- 外部监督形成舆论压力,增加压缩主题多样性的边际成本,促进更全面的披露。

执行薪酬激励的调节效应 [page::11][page::23]

  • 以前三甲高管薪酬和管理层总薪酬为指标,激励水平越高,越能缓冲亏损对主题多样性的负面影响。

- 高薪酬对应更强的绩效压力和长期治理意识,促使管理层维护信息披露的完整性。

监事会持股的调节效应 [page::11][page::24]

  • 监事会持股比例越高,监督强度越大,亏损对CSR多样性的负面影响越弱。

- 内部监控加强减少管理层短视行为,推动平衡披露策略。

多种稳健性检验强化结论 [page::12][page::13][page::14]

  • 对连续取值变量1%分位截尾处理,无特殊样本剔除,增加GRI标准控制,替代财务指标ROA,均验证了亏损抑制CSR多样性的结论。

- 工具变量法、倾向匹配法及置换检验进一步排除内生性与伪因果可能。

异质性分析 [page::15][page::30][page::31]

  • 第三方保证报告增强披露质量,弱化亏损影响。

- 关注工作安全内容时,亏损更集中资源且披露多样性降低。
  • 大型企业因资源及外部关注维持更高多样性。

- 竞争激烈行业中,亏损导致披露多样性收缩更明显。

研究贡献与实务意义 [page::16][page::17]

  • 方法上创新性使用LDA与多样性指标量化CSR结构性特征。

- 理论上融合资源限制与合法性理论解释亏损期间CSR披露策略。
  • 实务上建议管理层合理维持亏损期CSR多样性,监管机构推动动态差异化监管,评级机构关注多样性变化预警治理风险。

深度阅读

金融研究报告详尽分析报告


——《What influenced the lack of diversity in CSR after the company’s losses: evidence from topic modeling》

---

1. 元数据与概览


  • 报告标题:What influenced the lack of diversity in CSR after the company’s losses: evidence from topic modeling

- 作者:Ruiying Liu, Yuchi Li, Zhanli Li
  • 机构:中南财经政法大学文澜商学院;中国劳动关系学院劳动经济学院

- 时间:2006–2023年数据范围,具体发布时间未显示
  • 研究主题:研究中国A股上市公司财务亏损对其企业社会责任(CSR)报告多样性影响的机制,借助文本主题建模方法分析CSR信息披露的多样性变化。

- 核心论点:财务亏损显著压缩企业CSR报告的主题多样性,验证了“闲置资源假说”。媒体关注度、执行薪酬激励、监事会持股等外部和内部治理机制在一定程度上缓解了亏损对CSR多样性的负面影响。
  • 研究意义:提供了财务困境如何影响非财务信息披露结构的实证证据,有助于优化企业CSR沟通策略,完善评级机构评价体系,并对监管制定多样化信息披露标准提出建议。

- 关键词:CSR多样性、公司亏损、潜在Dirichlet分配(LDA)
  • JEL分类:G30(公司融资及财务政策)、M10(一般管理、企业策略)、C55(时间序列分析及面板数据)[page::0]


---

2. 逐节深度解读



2.1 引言(Section 1)


  • 关键点总结

- CSR起源于20世纪,经历了从伦理框架到利益相关者理论的演进,逐渐从“成本中心”转变为企业长期价值的战略杠杆。
- 中国的CSR披露受政策驱动,起点为2006年深圳证券交易所社会责任指引,CSR报告义务逐步制度化,但初期披露多为合规性陈述,信息质量有待提升。
- 全球气候变化及可持续议题推升信息披露从“合规性应对”向“主动沟通”转变。随着联合国全球契约和GRI标准的施行,CSR披露趋于规范。
- 中文文本分析多依赖定制词典,或存在选择偏差,主题建模(LDA)更适合捕捉潜在话题结构和多样性。
- 报告强调CSR主题多样性作为信息透明度关键指标,有利于中和选择性披露噪声,提高跨市场可比性。
  • 推理依据:借助文献梳理和中国CSR披露制度演变背景,作者展示了CSR披露的重要性及现存问题,并提出文本主题建模作为突破口。

- 历史及过程:从Bowen定义CSR,至一系列理论模型与全球治理规范,结合中国制度特点勾勒背景框架。
  • 文献引用:广泛涵盖CSR与ESG领域关键理论与实证研究(Bowen, Carroll, Freeman, Chen et al., Cohen et al., Lu等)[page::1,2]


2.2 理论框架与假设(Section 2)


  • 核心论点

- 财务亏损导致资源紧张,支持“闲置资源假说”(slack resources hypothesis),企业削减非核心CSR披露,导致主题多样性下降(H1)。
- 合规性与合法性压力形成张力,企业倾向“最低成本合规”,保持核心主题披露而减少多样性,避免“漂绿”风险。
- 三个调节机制(H2a-c)可能缓和亏损对CSR多样性压缩的影响:
1. 媒体关注度(外部监督)提升亏损企业维护多样性的动力,防止负面信息扩散;
2. 执行薪酬激励(内部激励)促使管理层保持披露的完整性和平衡;
3. 监事会持股比例(内部监督)使管理行为更受长远利益约束,加强信息披露多样性。
  • 推理假设:结合资源约束理论(资源优先用于刚性支出)和合法性理论(维护社会认可),强调两者对企业CSR行为的共同制约。

- 注意边界条件:市场监管严格、声誉敏感行业或通过外部监督具备强化合法性压力的企业可能表现出更强的多样性。
  • 明确假设声明:H1(亏损企业CSR主题多样性较低),H2a-c(媒体关注度、执薪酬、监事持股在亏损时正向缓冲效应)[page::3,4,5]


2.3 数据与方法(Section 3)


  • 样本选择

- 选取中国A股上市公司2006-2023年,数据来源主要为CSMAR、CNRDS及CNINFO平台文本爬取。
- 2006年起因CSR首次写入《公司法》,制度化起点明显。
- 保留ST及金融行业样本,因其财务困境和披露特点特殊,避免样本选择偏误。
- 最终样本共2,257家企业,13,797个样本期。
  • 文本处理与主题提取方法

- 利用结巴分词扩充定制词典,去停用词、标准化处理文本。
- 采用LDA主题模型抽取主题分布,视为文档在各主题上的概率权重。
- 主题数K及模型超参数通过log-perplexity指标验证,利用Optuna TPE算法自动调参。
  • 主题多样性测度

- 选用Gini-Simpson指数(衡量主题分布平衡度,越大则多样性越高)和Shannon entropy(信息熵,反映不确定度和均匀度)双指标。
- 两指标年间分布趋势相似,均用于后续稳健性检验。
  • 回归模型

- 设定下一期CSR多样性为因变量、当期亏损为主要解释变量,控制公司规模、杠杆、现金流、固定资产率、大股东持股、董事会规模、托宾Q等。
- 固定企业及年份固定效应,错误项聚类调整。
  • 描述性统计总结各变量均值、标准差、分位数,亏损率约10.74%,主题多样性处于中等水平。

- 图表参考:
- 图1与图2(见图9页图示)表现多样性指标年度箱线图,反映多样性整体趋势及波动。
- 箱形图中位数显示主题多样性整体趋势稳健,个别年份(2006较高,2011-2019较低),指披露制度和市场环境演化影响。

Figure 1: Gini-Simpson Distribution Across Firms 2006-2023

Figure 2: Shannon Entropy Distribution Across Firms 2006-2023
  • 分析要点:两种指标互为验证,多样性波动体现行业标准和政策效应。[page::6,7,8,9]


---

3. 图表深度解读



3.1 图1与图2 — CSR主题多样性年度分布箱线图


  • 描述:图1和图2分别展示基于Gini-Simpson指数和Shannon熵的CSR报告主题多样性在2006-2023年各企业间的分布。箱形图展示了中位数、四分位间距及异常值。

- 解读:整体多样性保持稳定,中位数在0.5以上,反映多数企业偏向中等主题覆盖度。2006年多样性较高,随后10年维持较低水平,反映制度初期未形成统一规范,下游企业披露较为分散。2019年后有所回升,或受环境与社会责任法规加强影响。
  • 联系文本:多样性指标验证了监管推进、市场偏好转变对企业CSR披露行为的影响,为后续实证分析亏损影响提供基础测度。

- 局限:年度变化可能受到样本结构、宏观经济大环境影响,单纯指标不反映内容深度和可信度。
  • 结论:多样性指标适合作为CSR披露的客观量化手段,支持后续回归分析。[page::9]


---

4. 估值与实证结果分析



4.1 基线回归(Section 4.1)


  • 核心结果:亏损对企业CSR报告主题多样性影响显著且为负,无论Gini还是熵指标均表现出高度稳健的负系数(约 -0.017 至 -0.043,均于1%显著水平)。控制多项财务及治理变量后,结果基本保持一致。

- 推理:验证了假设H1,即亏损企业因资源紧张倾向于减少非核心主题披露,采取“最小成本合规策略”。
  • 表格参考:表3(页21)显示各回归结果及显著性。

- 统计及方法考量:采用企业及年份固定效应,有效控制潜在异质性及时间趋势;聚类标准误提升稳健性。
  • 结论:亏损确实压缩CSR信息披露的主题多样性,为理解财务压力下非财务信息披露缩减提供实证支持。[page::10,21]


4.2 媒体关注度的调节效应(Section 4.2)


  • 实证设计:利用新闻报道数量(正面、中性、负面)作为媒体关注度指标,与亏损交互检验对CSR主题多样性的影响。

- 结果解读:交互项系数均显著正向,尤其负面新闻的调节效果最强,表明外部监督压力促使亏损企业扩大核心披露范围,维持较高主题多样性以防“漂绿”指责和融资风险。
  • 表格参考:表4(页22)详细展示不同新闻色调下的调节效应。

- 实际意义:媒体作为重要的外部监督力量,提升亏损企业的合法性压力,促使其披露多维信息。
  • 补充说明:正面新闻调节效力弱,说明压力主要来源于公众和投资者负面评价。

- 结论:支持H2a假设,即媒体关注可减缓亏损导致的CSR多样性压缩。[page::10,22]

4.3 执行薪酬的调节效应(Section 4.3)


  • 方法:采用高管薪酬总额(前三高管薪酬和全部管理层薪酬)与亏损交互检验。

- 发现:与亏损交互项显著正向,尤其前三高管薪酬调节效应稳定且强烈,表明高激励管理层更倾向于维护完整且平衡的CSR披露,防止企业陷入信誉危机。
  • 表格参考:表5(页23)展示薪酬调节结果。

- 理论联系:薪酬与绩效紧密关联,提高管理者关注非财务披露的质量,支持长期价值创造。
  • 结论:证实H2b,内部激励机制对调节亏损影响具有重要作用。 [page::11,23]


4.4 监事会持股的调节效应(Section 4.4)


  • 背景:监事会持股强化内部监督,降低代理成本。

- 结果:亏损与监事持股交互项正向显著,监事持股比例更高时,亏损带来的CSR多样性压缩效应减弱。
  • 表格参考:表6(页24)列示回归细节。

- 含义:内部权责统一使管理层披露策略更受约束,非财务信息披露更全面。
  • 结论:支持H2c,强调治理结构在信息披露中的监管作用。 [page::11,24]


---

5. 稳健性检验(Section 4.5)


  • 方法与结果

- 变量极端值处理(1% Winsorize)、排除ST及金融行业数据、增加GRI标准遵守控制变量;
- 替换亏损二元变量为连续ROA指标;
- 工具变量估计(IV),利用未来CSR多样性与盈利指标交互作为工具变量,解决内生性;
- 倾向得分匹配(PSM)缓解函数形式错误偏误;
- 随机重分配亏损变量的安慰剂检验,均支持基线结论的稳健性。
  • 表格与图示参考:表7(极端值与特殊样本)、表8(新增控制与替换变量)、表9(2SLS结果)、表10(PSM结果)、图3、图4(安慰剂检验)

- 结论:多种方法交叉验证结论稳健可靠,亏损确实会压缩CSR主题多样性。 [page::12,13,14,25,26,27,28,29]

---

6. 异质性分析(Section 4.6)


  • 6.1 第三方保证(外部监督)

- 经第三方保证的报告在亏损期间显示出更高的主题多样性,缓解亏损压缩效应,表明专业审计或认证增强信息披露的可信度和广度。
- 表11(列1-2)验证此结论。
  • 6.2 披露内容侧重—工作安全

- 披露工作安全内容的亏损企业反映了资源向最核心合法性主题倾斜,从而导致整体报告主题多样性降低。
- 表11(列3-4)显示此负相关,说明工作安全作为合法性“安全牌”被优先保留。
  • 6.3 企业规模

- 大型企业规模效应明显,其报告在亏损期能维持较高主题多样性,归因于规模效益和更高外部压力。
- 表12(列1-2)呈现正向调节。
  • 6.4 行业竞争程度

- 高竞争行业的亏损企业减少CSR主题多样性的程度更明显,反映市场生存压力下资源配置极端化。
- 表12(列3-4)呈显著负向交互效应。
  • 总结:企业外部监督、内部资源配置策略、规模和行业特征共同作用,影响财务压力对信息披露结构的影响差异。[page::15,16,30,31]


---

7. 结论与启示(Section 5)


  • 报告核心结论

- 财务亏损显著压缩CSR报告主题多样性,验证了资源闲置假说与合法性理论的复合解释模型;
- 外部(媒体关注)、内部(高管薪酬、监事持股)治理机制有效缓和该效应;
- 第三方保证、报工作安全内容披露、大型企业及非竞争行业表现出更好的信息披露宽度维持能力。
  • 贡献亮点

- 方法论创新:用LDA主题建模及多样性指数从结构而非单纯强度解析CSR披露;
- 理论深化:融合资源约束与合法性双视角,厘清财务困境下CSR披露策略;
- 实践价值:为企业管理者提供优化CSR策略建议,为监管机构提供针对性政策设计思路,为投资者及评级机构增添风险预警信号。
  • 政策建议

- 企业避免将CSR视为仅有利时的形象工程,应重视亏损期的多样化信息披露;
- 监管推动差异化监管,强化对连续亏损企业的监督,推行披露结构评价指标,推广第三方保证;
- 投资者关注CSR主题多样性变化,把握短期内公司战略与治理稳健性。
  • 研究局限

- LDA无法完全反映信息深度、准确性与语义情感,未来可结合情感分析等方法;
- 内部决策流程尚未揭示,需案例访谈;
- 仅限CSR正式报告,社交媒体及新闻披露的替代性关系有待深入研究。
  • 整体立场:报告坚定陈述亏损对CSR多样性造成负面压力,倡导多层面治理提升披露质量,强调CSR披露的结构完整性是公司可持续发展的关键要素。[page::16,17]


---

8. 关键图表总结



| 图表名称及页码 | 说明及作用 | 重要发现与洞察 |
|----------------|------------|----------------|
| 图1 & 图2 (页9) | CSR报告主题多样性(Gini-Simpson, Shannon entropy)年度箱线图 | 多样性走势稳定,2006年较高,2011-2019较低,后期回升,反映制度发展与市场关注变化 |
| 表1 (页19) | 主要变量定义 | 明确CSR多样性测度,财务指标与媒体、薪酬、监事持股等解释变量定义 |
| 表2 (页20) | 主变量描述统计 | 亏损率约10.7%,CSR多样性中等偏低,媒体报道分布大幅不均,反映样本异质性 |
| 表3 (页21) | 基线回归,亏损与CSR多样性关系 | 亏损显著负向影响CSR主题多样性,控制变量后稳健,支持H1 |
| 表4 (页22) | 媒体关注的调节效应(正/中性/负面新闻) | 媒体关注尤其负面新闻缓解亏损导致的多样性压缩,体现外部监督效力 |
| 表5 (页23) | 执行薪酬调节效应 | 更高薪酬管理层缓和多样性收缩趋势,体现内部激励机制积极作用 |
| 表6 (页24) | 监事会持股调节效应 | 持股比例增加提升监督,有助维护多元CSR披露 |
| 表7 & 表8 (页25-26) | 稳健性检验(极端值处理、样本剔除、GRI控制、替代变量ROA) | 亏损影响结果稳健一致 |
| 表9 (页27) | 工具变量2SLS估计 | 解决内生性后亏损影响依旧显著,强化因果推断 |
| 表10 (页28) | 倾向匹配法 | 匹配样本中亏损仍导致CSR多样性下降,支持主结论 |
| 图3 & 图4 (页29) | 安慰剂测试分布图 | 随机置换亏损变量不显著,排除伪相关可能 |
| 表11 (页30) | 第三方保证与工作安全异质性 | 第三方保证缓解亏损负效应,工作安全披露体现资源倾斜,导致其他主题减少 |
| 表12 (页31) | 企业规模与行业竞争异质性 | 大企业抵御亏损多样性压缩,竞争激烈行业加剧压缩 |

---

9. 审慎视角与细节分析


  • 潜在偏见与限制

- LDA主题模型依赖语料和参数设定,难捕捉深层语义和披露真实性,仅反映话题分布层面。
- “最低成本合规”策略推断在不同企业间差异可能被潜在异质性掩盖。
- 媒体报道和高管薪酬仅为代理变量,未完全涵盖所有外部内部治理复杂性。
  • 内部一致性

- 报告整体假设逻辑严谨,实证设计符合理论框架;
- 异质性分析为复杂企业环境提供细致区分,增强结论解释力。
  • 研究空间

- 内部决策机制未明,缺乏管理层采访或行为跟踪的补充数据;
- 社交媒体、新闻媒体披露与正式报告的互补关系需进一步探索;
- 未来可融合多模态文本分析提升CSR质量衡量维度。

---

10. 结论性综合总结



本研究首次采用LDA潜在主题模型与多元信息熵指标系统量化中国A股上市公司CSR报告的主题多样性,实证检验了财务亏损对非财务披露结构的影响机制。研究发现,企业亏损显著压缩CSR信息披露的主题多样性,验证了资源约束引导企业在财务压力下优先保障核心业务合规性而非全面披露的“最低成本合规”假说。外部媒体监督、内部执行薪酬激励与监督权持股比例有效缓解了亏损对信息披露多样性的负向压缩,显示多层治理框架在非财务披露中的重要作用。异质性分析揭示第三方保证、报告侧重工作安全、大型企业和非竞争行业对披露多样性保护起到关键影响。通过多角度稳健性检验与严格的内生性控制,结论稳健可靠。实践层面,研究强调企业应避免在亏损时盲目缩减CSR披露多样性,以维护合法性与长期价值,监管机构应强化对财务困境企业的差异化监督和第三方认证推广,投资者与评级机构可利用CSR多样性作为风险识别与治理评估的重要补充指标。研究创新地将文本主题结构视为非财务信息的质量关键维度,深化了财务状态与信息披露交互的理论理解,并为相关多元政策设计提供数据支持和理论依据。

---

综上,该篇报告结构严谨,理论与实证相辅相成,数据丰富且方法创新,对理解财务压力下CSR报告的内容多样性变化机制具有重要学术和现实意义。

---

注:全文所有引用均依据页码标识,如[page::3], [page::9-10], [page::27]等,便于溯源。

报告