用于股票投资组合优化的强化学习模型中的隐藏层配置
由googleglass创建,最终由googleglass 被浏览 5 用户
摘要
文章首先介绍了人工智能在金融市场中的应用,特别是强化学习在投资组合优化中的作用。强化学习作为一种机器学习方法,通过智能体与环境的交互来学习最优决策策略,以最大化累积奖励。文章提到,强化学习在动态资产配置中表现出色,能够有效管理交易成本和优化资产配置。
研究方法
研究采用了FinRL框架,这是一个用于量化金融中深度强化学习的开源框架。该框架包括环境层、智能体层和应用层,支持多种DRL算法,并提供预配置的环境和广泛的回测工具。研究中,智能体根据输入状态(包括开盘价、最高价、最低价、收盘价和交易量)做出决策,目标是优化投资组合的表现。
实验设计
实验中,研究者选择了45只印尼股市的股票,这些股票是LQ45指数的一部分,代表了印尼股市中最具流动性和活跃度的股票。研究使用了多种金融指标来评估投资组合的表现,包括总资产价值(TAV)、年化收益率(ARR)、累积收益率(CuR)、最大回撤(MDD)和年化夏普比率(ASR)。
实验结果
实验结果显示,A2C和DDPG在没有隐藏层时表现最佳,A2C在所有配置中实现了最高的累积回报(CuR)和年化回报率(ARR),分别为51.54%和49.39%。DDPG在无隐藏层模型中也表现出色,其年化夏普比率(ASR)最高,为0.94。相比之下,PPO在所有配置中表现不佳,尤其是在没有隐藏层时,出现了负回报。然而,增加隐藏层后,PPO的表现有所改善,尤其是在增加一个隐藏层后,其CuR和ARR分别达到了55.27%和52.94%。TD3的表现则相对稳定,但在增加隐藏层后,其表现并没有显著提升。
关键结论
研究的关键结论是,隐藏层配置对强化学习模型在股票投资组合优化中的表现有显著影响,且这种影响取决于具体的算法。A2C和DDPG在没有隐藏层时表现最佳,而PPO则需要至少一个隐藏层才能达到较好的表现。此外,增加隐藏层并不总是能提升模型的表现,有时甚至会导致过拟合或降低风险调整后的回报。TD3在不同配置下表现稳定,但没有隐藏层时表现最好。
研究意义
这项研究为学术界和实际投资管理提供了新的见解,表明通过调整隐藏层结构可以优化强化学习模型,以平衡回报和风险。这对于开发基于AI的投资组合管理系统,如机器人交易和咨询平台,具有重要意义。
/wiki/static/upload/d2/d2028c86-37ba-44f0-a4bd-0b4927c7db82.pdf
\