LLM赋能资产配置:基于新闻数据的AI宏观因子构建与应用
创建于 更新于
摘要
本报告基于大语言模型(LLM)从海量新闻文本提炼宏观信息,构建了高频AI经济增长因子和地缘政治因子。研究设计了“任务解耦”与“减轻幻觉”的多模型协同框架,以高质量标注和微调Bert模型实现因子构建。实证表明,AI因子在敏锐捕捉宏观经济边际变化和地缘政治动态方面优于传统指标,且能有效指导股债、黄金资产择时,体现了较强的解释力和应用价值 [page::0][page::1][page::3][page::11][page::15][page::16][page::18]
速读内容
LLM赋能资产配置框架与方法论 [page::0][page::2][page::3]
- 采用“任务解耦”降低复杂性,将宏观分析拆分为多个子任务,针对性选用大语言模型(LLM)与轻量模型结合的方案;
- 引入提示工程及大小模型协同机制,缓解LLM幻觉问题,确保标注数据质量和结果稳定性;
- 预处理流程涵盖宏观新闻粗筛(基于Bert微调模型)、事件切割和去重,实现对非结构化文本的结构化提炼。
新闻数据与预处理及模型训练流程 [page::3][page::5][page::6][page::7][page::10][page::11]
- 样本来源于30家主流新闻机构,时间范围2014-07至2025-08,共筛选得642411条宏观新闻;
- 宏观新闻进一步拆分为1303072个子事件,标注国别/地区及时间性质(历史/现实/预期);
- 标注任务采用Qwen-Plus等LLM结合人工复核,设计多任务学习框架微调Bert模型(mengzi-bert-base-fin),实现多维度情感标注(相关性、方向性、强度);
- Bert模型效果优异:经济增长维度F1=0.9121,地缘政治维度F1=0.9810。
AI宏观因子构建与验证 [page::11][page::12][page::13][page::14][page::15]
- 构建经济增长和地缘政治两个核心因子,包含现实因子、预期因子和综合因子,采用滚动Z-score标准化处理;
- AI中国经济增长因子能快速响应政策变动及关税风波影响,长短周期因子与传统指标(花旗经济意外指数)走势高度相关;
- AI美国经济增长因子反映美国近期经济波动,体现预期与现实动态;
- AI地缘政治因子捕捉全球政治局势变化,2024年以来地缘紧张程度上升,预期与现实因子保持高度同步,表现细节比传统风险指数更丰富;
因子应用:资产择时实证 [page::16][page::17][page::18]
- AI中国经济增长因子与沪深300正相关,与7-10年国债净价指数负相关,相关性明显优于传统指标;
- 采用双均线趋势模型构建周频择时策略,股票策略年化超额收益6.55%,债券策略1.36%;
- AI地缘政治因子与COMEX黄金呈显著负相关,利用长短周期因子仓位调整策略回测显示4.41%年化超额收益;
- 2025年8月黄金仓位由25%提升至75%反映因子在实战中的有效信号。
研究局限与未来方向 [page::18][page::19]
- 局限包括数据覆盖面不足、基座模型性能限制和事件处理上下文损失;
- 未来拓展异构文本数据源、提升模型能力,构建动态事件图谱和开拓更多“软性”宏观维度因子。

AI经济增长因子构建流程效果对比及趋势表现 [page::9][page::12][page::13]



AI地缘政治因子与传统风险指标对比及趋势 [page::15]


AI宏观因子择时实证效果(中国股债与黄金)[page::16][page::17][page::18]
| 因子 | 资产 | 相关性 | 年化超额收益 |
|---------------------------|---------------------|----------|--------------|
| AI中国增长现实因子 | 沪深300(股票) | 0.4359 | 6.55% |
| AI中国增长现实因子 | 7-10年国债净价指数 | -0.6459 | 1.36% |
| AI地缘政治现实因子 | COMEX黄金 | -0.6943 | 4.41% |



深度阅读
华泰金工 | LLM赋能资产配置:基于新闻数据的AI宏观因子构建与应用 — 深度分析报告
---
一、元数据与概览
- 报告标题:LLM赋能资产配置:基于新闻数据的AI宏观因子构建与应用
- 作者:林晓明、徐特、李薇
- 发布机构:华泰证券金融工程部
- 发布日期:2025年09月25日
- 研究主题:应用大语言模型(LLM)从新闻文本构建宏观经济因子,尤其是经济增长因子与地缘政治因子,探讨其在资产配置中的应用价值。
核心论点:通过创新性的任务解耦与减轻幻觉框架,利用LLM从新闻文本中提炼出高质量的宏观信息,构建日频的AI宏观因子,验证其对资产价格(股债黄金)的解释力优于传统指标,展现较强的择时能力。特别强调LLM应作为认知增强工具而非决策替代工具。
---
二、逐节深度解读
1. 报告导读与研究动因
- 报告指出,市场由“叙事”驱动,传统量化模型只能量化经济数据等结果,但文本信息可深入刻画叙事本身。
- LLM等技术使得直接量化叙事成为可能,在宏观资产配置中可提升对宏观状态及资产互动关系的理解。
- 强调LLM的“幻觉”问题(错误推断、过度泛化、错误判断因果关系等)需要通过任务解耦,以及人工复核配合大小模型协同来缓解。
- 观点鲜明:赋能而非替代投资决策,LLM用于宏观认知“增强”,辅助决策更科学、更高效。[page::1]
2. 宏观信息提取的框架和预处理流程
- 新闻数据相较结构化数据包含多维、丰富、及时的宏观信息,但噪声较大,需要精细预处理。
- 新闻粗筛:用LLM生成高质量标注样本,微调轻量模型(Bert)完成大规模分类,实现效率与准确性的平衡。
- 事件切割:利用阿里云Qwen-Long系列LLM对新闻正文进行拆分为子事件,同时标注国别/地区与时间性质(历史/现实/预期),实现结构化处理。
- 去重基于语义相似度,筛选出高质量宏观子事件数据集。
- 预处理强调“任务解耦”、针对性模型选配和提示工程以减少幻觉输出。
- 数据来源涵盖新浪财经、人民网、新华网等30家主流机构,样本涵盖2014-2025年,确保宏观新闻覆盖全面且可靠。[page::0, 3, 4, 5, 6, 7, 8]
3. 因子构建流程与技术细节
- 因子核心是将宏观新闻事件转化为三个维度的情感分数:相关性判断(是否相关)、方向性判断(积极、中性、消极)、影响强度(0-1分)。
- 利用Prompt优化的LLM对2014-2020年新闻事件初步标注,再由人工复核以减轻幻觉,并训练集成多任务Bert模型进行知识蒸馏,实现大规模、性能稳定的宏观情感标注。
- Bert模型设计为多任务学习架构,三个任务分别对应二分类(相关性)、三分类(方向)、以及回归(强度),通过加权损失函数联合训练,解决训练数据不平衡问题。
- 微调后的Bert模型在测试集表现佳,经济增长维度相关性F1达0.9121,方向准确率90%以上,强度判别误差0.11;地缘政治维度表现更优。[page::1, 8, 9, 10, 11]
4. AI宏观因子的构建结果与分析
(1)AI中国和美国经济增长因子
- 认定宏观因子包含核心经济指标变化及前景判断。
- 从130万余宏观子事件中选得31万+相关事件,正负面新闻分别占约29%和24%,体现信息的多样性。
- 现实(R)与预期(E)类新闻年分布和正负面占比呈现动态变化,整体保持一定均衡。
- AI中国短周期因子能快速响应关键政策发布与宏观事件,如2024年刺激政策发布导致的因子迅速回升。此外,长周期因子与花旗中国经济意外指数走势一致,但差异明显,反映AI因子敏感度更高,细节更丰富。
- AI美国因子样本充分以来(2020年起)现实与预期因子趋势趋同,细节波动较传统指标更丰富。最新数据指示短周期经济复苏动能减弱。[page::11, 12, 13, 14]
(2)AI地缘政治与国际关系因子
- 聚焦地缘冲突、贸易冲突、重要外交言论等,构建全球宏观视角因子。
- 约10万宏观事件中,正负面新闻各占约27%,中性约46%,现实新闻略多于预期新闻。
- 2022年后负面新闻占比明显上升,表明地缘政治紧张趋势明显。
- 该因子与Caldara和Iacoviello (2022)地缘政治风险指数相比,表现出更丰富的细节和波动,能够捕捉更多维度的风险信息。
- 2024年以来,AI地缘政治长短周期因子均显示局势趋于紧张,且具备较强的市场解释力。[page::14, 15]
5. 因子在资产配置中的具体应用
(1)AI中国经济增长因子进行股债择时
- 相关性研究显示,AI经济增长因子与沪深300股票指数呈显著正相关(最高到0.7174),与7-10年国债净价指数呈显著负相关(最高绝对值0.6737),且强度超过传统经济意外指数和制造业PMI。
- 以滚动1年均值的AI因子周频为基础,应用历史研究中设计的双均线策略得出趋势信号,实现股票和债券的择时配置。
- 回测2016年至今结果显示,年化策略超额收益达6.55%(股票),1.36%(债券),且模型自2025年1月以来持续发出看多股票信号,显示稳定性强。
- 图表27-28展示AI经济增长因子择时下股债资产净值大幅跑赢基准。[page::16, 17]
(2)AI地缘政治因子用于黄金择时
- 以COMEX黄金期货价为标的,AI地缘政治因子与黄金价格呈强负相关(最高约-0.6943),显著优于传统地缘政治风险指数。
- 利用长短周期因子趋势得分合成及多档仓位判断规则对黄金资产进行仓位调整。
- 2020年至今回测表现良好,年化策略超额收益4.41%,最新仓位调整从25%增至75%。
- 图表30-32展示黄金与AI地缘政治因子动态变化及对应的择时策略净值表现。[page::17, 18]
---
三、图表深度解读
图表一(图3页)AI宏观因子与传统宏观因子构建流程对比
- 传统流程基于固定经济指标和结构化数据,步骤确定但信息有限,处理工具为统计模型。
- AI流程基于海量动态文本信息,非结构化数据预处理涉及事件分类和去噪,处理工具是大语言模型。
- 判断方式由机械规则转向语义深度理解,因子合成维度更为丰富。
- 框架强调开放迭代和识别宏观叙事,由此提升信息提炼的灵活性和深度[page::3]
新闻数据表(图4页)
- 收录多家主流权威新闻机构,覆盖财经、时政、金融等多个领域,确保样本全面和权威。
- 机构发布时间跨度长,可支持时间序列分析,且均为公开可用来源,利于后续研究的复现性。[page::4]
新闻示例和预处理流程说明(图5-6页)
- 报道内容丰富多样,示例涵盖军工、房地产、经济政策、公司公告等,体现新闻主题多元。
- 预处理聚焦构建多维分类体系和流程,结合人工复核以提升分类精度。
- 方案三(LLM标注+轻量模型)兼顾效率和准确度,应用场景广泛。[page::5, 6]
事件切割及分布(图7-8页)
- 子事件平均3个/新闻,充分拆解复杂叙事。
- 时间性质分布显示现实事件占比最高,历史事件不参与后续因子计算,保证因子对新信息敏感。
- 中国事件占50%以上,符合研究聚焦国内宏观经济和全球重要地缘政治事实的预期。
- 事件拆解示例明确,准确标注国别和时间性质,体现LMM对复杂文本的语义理解能力。[page::7, 8]
Prompt优化效果(图10-11页)
- 相关性和方向判断的优化前后比对表明,优化显著减少噪音,提高相关样本的识别准确度。
- 优化后“不相关”样本数量增多,中性判断增加,符合“无比较则中性”原则,反映LLM对事实与观点的判别更为严谨。[page::9]
Bert模型训练架构与效果(图12-13页)
- 明确展示多任务模型结构和三个输出头设计,技术细节完备。
- 模型性能优秀,验证了知识蒸馏及多任务学习方法的有效性,为稳定大规模标注提供保障。[page::10, 11]
AI经济增长因子走势与对比(图15-18页)
- 图15-16清晰展示AI中国增长因子在短期与长期视角下的波动,能明显捕捉宏观经济政策与外部事件变化对经济景气的反映,尤其短周期敏感。
- AI因子与花旗经济意外指数高度相关但更灵敏,显示AI文本因子的前瞻优势。
- 美国增长因子表现同样优异,细节丰富,确认文本因子在多市场的适用性。[page::12-14]
AI地缘政治因子与地缘政治风险指数对比(图20-21页)
- AI因子粒度更细,能捕捉更多事件信息与预期变化,表现出更丰富且更动态的波动。
- 高频数据助力更精细识别地缘风险,引导资产配置决策更加及时。[page::15]
资产配置相关性及择时效果(图22-28页)
- AI中国增长因子与股票与债券的相关性明显优于传统指标,体现其对股债市场的更强解释力。
- 择时策略回测显示明显超额收益且策略信号稳定。
- 股票与债券择时策略使投资者能够更有效捕捉经济周期波动,体现文本因子实际应用价值。[page::16,17]
AI地缘政治因子黄金择时(图29-32页)
- 地缘政治因子与黄金呈显著负相关性,符合理论避险资产属性。
- 择时投资组合收益显著优于基准,且仓位调整及时反映最新地缘态势。
- 验证文本因子对避险资产配置的指导价值。[page::17,18]
---
四、估值分析
报告不涉及具体企业估值模型和目标价,研究重点为宏观因子的构建与其资产配置的应用。估值层面主要体现在对资产配置结果的回测和相关性分析,展示AI因子在量化资产选择中的有效性。
---
五、风险因素评估
- 因子依赖的文本数据源可能未覆盖所有市场情绪,存在信息盲点。
- LLM固有的“幻觉”问题虽通过任务拆分和人工复核减缓,但依然不可完全消除。
- 使用较早版本的模型或一次性训练可能导致因子信息提炼不够精准,模型需周期滚动更新。
- 宏观事件主题聚类与长期演变序列未充分构建,潜在事件关联性和脉络处理相对粗糙。
- 当市场结构性变化发生,历史规律总结的因子可能失效。
- 数据隐私与信息安全风险:如非本地部署大模型调用存在数据泄露隐患。[page::18, 19]
---
六、批判性视角与细微差别
- 报告坚持LLM赋能而非替代的理性科技观,反复强调通过“任务解耦+人工复核+蒸馏小模型”缓解幻觉问题,科学且务实。
- 仍存在模型性能限制与数据覆盖面的不足,限制因子深度和广度,尤其文本仅反映较公开和客观层面,难以把握市场分歧或深层情绪。
- 事件拆解固然解决了复杂文本信息融合的难题,但也带来了上下文丢失和事件关联信息缺失的隐忧。
- 因子构建流程展示迭代性强,未来可通过基座模型升级持续优化,强调了技术升级路径。
- 报告尚未涵盖非新闻文本数据(如政策文件、社交媒体等)整合,未来空间较大。
- 系统性幻觉风险虽被一定程度控制,但仍可能影响因子稳定性,特别是在复杂且快速变化的宏观环境中。
- 报告评估了不同新闻分类方案利弊,选择折衷方案合理,但对高频处理速度和准确率的具体折中细节缺乏数据说明。
- 在资产配置应用侧,虽择时效果良好,但未考量交易成本和市场冲击,实际应用时需谨慎。[page::0-20]
---
七、结论性综合
华泰金工本报告系统地展示了利用LLM技术从海量新闻文本构建AI宏观因子的创新框架和实践路径,提出“任务解耦”与“减轻幻觉”原则,结合提示工程、人工复核与轻量模型微调,实现对宏观新闻的高精度结构化情感标注。构建的经济增长因子和地缘政治因子明确提升了宏观信息刻画的频率与精度。
特别是:
- AI宏观因子能及时捕捉宏观边际变化,提供更丰富、多维度的非结构化宏观认知。
- AI经济增长因子对中国及美国市场的短周期与长周期经济动向反映敏锐,并优于传统经济指标。
- AI地缘政治因子全面映射地缘政治紧张程度与国际关系动态,优于传统地缘风险指数。
- 多因素与多时间尺度的设计增强了因子解释力和应用灵活性。
- 实证应用显示,AI中国增长因子在沪深300和中国债券指数的择时策略均带来显著超额收益;AI地缘政治因子则显著提升了黄金资产的择时表现。
- 报告充分展示了以文本为主的另类数据如何赋能宏观量化投资,开拓了文明与计算结合的资产配置新范式。
报告同时坦诚当前方法的局限性,未来可通过多元化文本数据整合、高性能动态模型训练及事件图谱构建加以改进,增强宏观因子的深度与广度。
综上,华泰金工提出的基于新闻数据的LLM赋能AI宏观因子构建框架,技术先进,逻辑严密,应用成效显著,为宏观资产配置提供了有力的理论与实证支持,值得行业关注与深度跟进。
---
参考文献
- Caldara, D., & Iacoviello, M. (2022). Measuring Geopolitical Risk. American Economic Review, 112(4), 1194-1225.
---
附录:关键图表展示
- 图3:传统宏观因子vs AI宏观因子构建流程对比

- 图5:分年度原始新闻和切割事件数量统计

- 图10-11:LLM标注前后相关性及方向判断对比(经济增长)


- 图12:Bert模型训练流程图

- 图15:AI中国增长因子(滚动3个月均值)

- 图20-21:AI地缘政治因子与地缘政治风险指数对比


- 图27-28:AI中国增长因子股债择时净值表现


- 图32:AI地缘政治因子黄金择时净值表现

---
本次分析基于全部提供页码0至20的内容,完整涵盖报告所有核心章节、数据解读、技术流程、实证结果及图表内容。