在量化交易与数据科学领域,特征工程是一个至关重要的步骤,直接影响到模型的预测能力与效果。OpenFE 是一个开源的特征工程框架,旨在帮助研究人员和工程师快速生成高质量的特征。然而,原始版本的 OpenFE 算子虽然功能强大,但在某些应用场景下仍存在一定的局限性。为了更好地满足我们在量化研究中的需求,我对 OpenFE 算子进行了重新构建,丰富衍生特征生成;并将其与 XGBoost 相结合,用于特征重要性评估,方便后续标的打分。
本文将详细介绍这一重构过程,并通过实际案例展示如何使用这一改进后的算子生成衍生特征,并使用 XGBoost 进行特征重要性评估,从而优化我们的量化模型。
更新时间:2024-12-24 06:43
在深度学习的所有应用场景中,股价预测也无疑是其中一个异常诱人的场景。随着传统线性模型的潜力逐渐枯竭,非线性模型逐渐成为量化交易的主要探索方向,深度学习对非线性关系良好的拟合能力让其在量化交易中面临着广阔的应用前景。但与常规的回归预测任务不同的是,股价预测问题有其独特性,存在时间序列、噪声高、过拟合等问题。当前对于深度学习在股票交易中的研究主要侧重在因子挖掘、图神经网络与知识图谱、新闻与社交媒体等非结构化数据的利用、以及时序模型改进四个方面。我们会在文章中依次探讨近5年顶会上对这四个方向的研究。
本文主要介绍MSRA在KDD 2019上发表的两篇文章,这两篇文章主要关注深度学习在
更新时间:2024-12-05 06:16
MeetUP直播答疑 时间:8月24日(周四)19:00 回放视频请访问宽客学院-双周答疑-79thMeetup
\
**问题1:我主要使用价格K线形态来进行买入卖出依据,但是仅使用数学公式来描述形态(三角形,W,茶杯,头肩顶等)感觉比较局限,和难抓住我用眼睛能看到的内容(同样也表示这个东西比较主观)。能否我进行人工挑选,例如将我看到的:3月10日到5月7日XX股票是一个头肩底,将不同的形态打上不同的标签,找出成百上千个这样的形态作为训练集喂给AI,然后反过来让AI识别出过去历史上所有这些形态然后进行回测,不知这种做法是否可行,以及在代码模型
更新时间:2024-08-22 03:51
[https://www.bilibili.com/video/BV1Gr4y177FR?share_source=copy_web&vd_source=2e7dc1240ea373ea6eba1134af8dd086](https://www.bilibili.com/video/BV1Gr4y177FR?share_source=copy_web&vd_source=2
更新时间:2024-06-07 10:55
本期提问者:bq22fw19、bq61ym2n、1855680***、bqhz06vb
利用市场信息进行量化投资主要涉及以下步骤:
更新时间:2024-06-07 10:55
AIStudio是BigQuant平台以AI为核心的Cloud IDE,可以用于量化投资数据分析、因子挖掘、模型训练、回测和交易以及更广泛的程序开发和AI模型开发训练等。
快速入门
点击顶部导航栏中的【编写策略】即可启动AIStudio,或点击AIStudio超链接直接跳转。
初次启动可能需要一些时间,请耐心等待。
启动过程中可以点击"签到领宽币",获得50宽币的奖励。
![加载页面](/wiki
更新时间:2024-05-22 15:05
它是一个基于Python的库,旨在通过遗传编程(Genetic Programming, GP)实现机器学习的功能。遗传编程是一种自动化的机器学习方法,通过模拟达尔文的自然选择理论来解决问题。它属于遗传算法的一种,通过选择、交叉(杂交)、变异等操作对程序(个体)进行迭代,以产生更好的解决方案。gplearn主要用于回归和符号回归任务,可以自动生成解决特定问题的数学模型或符号表达式。它的灵感来自于 scikit-learn,可以用于自动化发现数据中的关系,创建复杂的模型或因子。在金融领域,gplearn可以用于因子挖掘,帮助发现影响股票价格
更新时间:2024-05-20 03:04
本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明
新版量化开发IDE(AIStudio):
https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW
新版模版策略:
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
新版数据平
更新时间:2024-05-16 03:41
我用遗传规划 挖觉的因子 是product(return_0, 3) 还是(return_0, 3) 这个product是什么意思
\
更新时间:2023-10-09 02:22
AIStudio是BigQuant平台以AI为核心的Cloud IDE,可以用于量化投资数据分析、因子挖掘、模型训练、回测和交易,以及更广泛的程序开发和AI模型开发训练等。
/wiki/static/upload/31/315c1087-6d07-491a-90ef-43e717997077.mp4
\
更新时间:2023-09-07 03:12
\
更新时间:2023-06-27 03:23
因表达式规划下的价量因子挖掘
多因子模型能够持续改进的核心是持续有效地发现有显著选股能力的因子。基因表达式规划是一种启发式算法,其借鉴生物基因进化的思想,能够通过不断变异与进化来发现更好的解。因此,本报告中我们基于基因表达式规划来挖掘有效的价量因子。
在短周期价量数据构造的因子中,大部分因子选股效果的单调性并不显著,还有很多因子的多头没有超额收益,因此在设置因子有效性筛选指标时,我们结合了因子的ICIR、多头超额收益以及分组收益的单调性,综合考察因子的选股效果,实际挖掘出的因也具有较为单调和显著的选股效果。
基于挖掘因子构建指数增强组合
我们将挖掘得到的周
更新时间:2023-06-01 14:28
本文第一部分对alpha101因子在A股市场有效性和相关性进行探讨,筛选出有效性、独立性均较强的alpha因子作为基础量价因子库;第二部分,基于遗传规划算法进行交易型量价因子再挖掘,对基本算子进行组合重构,使因子风格中性化后仍具有较强有效性。
对alpha101因子构建方法进行解析,并检验因子有效性和相关性。结果显示,因子具有较强有效性,从Rank_IC、分层效果、组合收益等角度筛选,22个因子在周度频率上表现较好,11个因子在月度频率上表现较好,有效因子整体表现出较高收益率,但是在2017年均出现不同幅度回撤;因子相关性方面,alpha因子值截面相关性较低,此外,alpha因
更新时间:2023-06-01 14:28
重要提示:通过本订阅号发布的观点和信息仅供中信建投证券股份有限公司(下称“中信建投”)客户中符合《证券期货投资者适当性管理办法》规定的机构类专业投资者参考。因本订阅号暂时无法设置访问限制,若您并非中信建投客户中的机构类专业投资者,为控制投资风险,请您请取消关注,请勿订阅、接收或使用本订阅号中的任何信息。对由此给您造成的不便表示诚挚歉意,感谢您的理解与配合!
本文介绍了一种基于openFE的基本面因子挖掘方法,将三大报表的数据以及基础算子之间按照一定的结构进行排列组合,构建出70万个不同风格类型的因子,再利用openFE的两步筛选法,筛选出不同风格类型下表现最好的合成因子。
更新时间:2023-06-01 14:28
本文对遗传规划提出了三个改进方向,进一步提升其因子挖掘能力本文是对华泰金工前期报告《基于遗传规划的选股因子挖掘》(2019.6)的补充和改进,目的是进一步提升遗传规划挖掘选股因子的能力。本文提出并测试了 3 个改进方向:(1)新的适应度指标——因子互信息和多头超额收益;(2)非线性因子的使用方法;(3)交叉验证控制过拟合。测试中展示了20 多个挖掘出的选股因子供投资者参考。通过方法论的介绍,本文旨在说明遗传规划或许能挖掘出大量因子(尤其是非线性因子),这对于能够利用非线性因子的机器学习选股模型来说具有重要意义。
新的适应度指标——因子互信息和多头
更新时间:2023-06-01 14:28
发布时间:2019年6月10日
研究团队:华泰金融工程
研究员:林晓明S0570516010001、陈烨S0570518080004
本文通过原理分析和系统测试,介绍了遗传规划在选股因子挖掘中的应用 遗传规划是一种启发式的公式演化技术,通过模拟自然界中遗传进化的过程来逐渐生成契合特定目标的公式群体,适合进行特征工程。将遗传规划运用于选股因子挖掘时,可以充分利用计算机的强大算力,同时突破人类的思维局限,挖掘出某些隐藏的、难以通过人脑构建的因子。本文介绍了遗传规划应用的完整流程,对遗传规划程序包gplearn进行了深度定制改进。测试结果显示,遗传规划能从有限的量价数据中挖掘
更新时间:2023-06-01 14:28
国内量化发展已有十余年,各家机构投资者的Alpha因子库已有较大规模,这时面临的问题是,继续花时间和精力进行因子挖掘扩充因子库是否划算,还能带来多少增量收益。我们尝试将近年来兴起的机器学习算法应用到Alpha模型上,进行低频层面的因子挖掘,考察机器因子库相对人工因子库的增量
本文首先利用遗传规划算法进行因子挖掘,再将机器因子库与人工因子库通过随机森林模型转换为预测收益率,从组合层面进行因子库效果的整体比较。考虑到技术类因子和财务类因子历史表现差别较大,我们将这两类因子的挖掘和对比分开进行
遗传规划是一种启发式的进化策略算法,可以用来进行选股因子挖掘。遗传规划算法的主要想法
更新时间:2023-06-01 14:28
请问下bq平台用哪个包做因子挖掘?pip list不能运行,也看不到有哪个包,麻烦指下路,多谢!
您指的因子挖掘具体使用的算法是什么呢?这边可以和您具体沟通下。像遗传算法做因子挖掘平台都是有集成的。
你想安装什么包呢?可以给我们反馈,后续可以支持。
更新时间:2023-06-01 14:26
更新时间:2023-06-01 14:26
遗传规划我加上了选股条件进行因子挖掘,日志中pass指验证通过的因子数量,为何我
m1.factors.read() 取值是空,是否是因为我加了筛选条件有问题
如下图,测试集中有适应度为2的因子, \n
[https://bigquant.com/experimentshare/fff6b8873da540a08a3da4889f1c0566](https://bigquant.com/experiments
更新时间:2023-06-01 02:13
在系列专题报告《选股因子系列研究(五十六)——买卖单数据中的Alpha》、《选股因子系列研究(五十七)——基于主动买入行为的选股因子》、《选股因子系列研究(五十八)——知情交易与主买主卖》中,我们从不同的角度对于逐笔成交数据中的信息进行了挖掘,并得到了一些具有显著选股能力的因子。本文旨在对于筛选得到的有效因子进行梳理。逐笔因子在正交后具有显著的全市场月度选股能力。因子月均IC在0.03~0.04之间。正交后的各逐笔因子皆呈现出了较强的稳定性。除了买单集中度之外,其余因子年化ICIR皆超过2.0。
指数范围会对因子选股能力产生影响。在中证800指数内,大买成交金额占比、盘中主
更新时间:2022-09-01 13:34
期权作为现货的衍生产品,其交易情况暗含了投资者对市场的观点,期权交易日益活跃,可以从中获得有效且领先于现货市场的信息,兴业水晶球策略于2015年中推出,至今已有三年多样本外数据,其致力于挖掘期权市场中符合经济学逻辑且统计规律显著的因子,对期权标的现货(50ETF)进行短期的预测,无论是策略的整体表现,还是在历次市场拐点的判断上,都非常优秀。
目前上证50ETF期权的主要投资群体是通过考试的专业投资者,具有一定的前瞻性,他们对现货的未来走势预期可能相对会更加准确。如果能够充分地挖掘这部分投资者的情绪,就可以利用从期权中获得的信息对现货进行择时,这也是水晶球择时的基本逻辑。
符
更新时间:2022-08-31 07:31
发布时间:2019年6月10日
研究团队:华泰金融工程
研究员:林晓明S0570516010001、陈烨S0570518080004
本文通过原理分析和系统测试,介绍了遗传规划在选股因子挖掘中的应用 ====遗传规划是一种启发式的公式演化技术,通过模拟自然界中遗传进化的过程来逐渐生成契合特定目标的公式群体,适合进行特征工程。将遗传规划运用于选股因子挖掘时,可以充分利用计算机的强大算力,同时突破人类的思维局限,挖掘出某些隐藏的、难以通过人脑构建的因子==。==本文介绍了遗传规划应用的完整流程,对遗传规划程序包gplearn进行了深度定制改进。测试结果显示,==遗传规划能从
更新时间:2022-08-30 10:52
人工智能在量化投资领域已有哪些应用实践?
未来发展将走向何方?
模型测试、因子挖掘、另类数据、对抗过拟合、生成对抗网络以及其他综合领域,有何前沿成果?
6月6日(周一)-6月10日(周五),“华泰人工智能量化研究5周年论坛”,2天主论坛与6场主题分论坛,连续5天,与您聊聊人工智能量化研究的前沿内容。
宽邦科技首席策略官 邵守田受邀,与您于16∶05-16∶35聊聊《 量化选股中Al算法应用最佳实践》。
参与方式:
行知App全程直播
扫描下方二维码直达 ![{w:100}{w:100}](/wiki/api/attachments.redirect?id=e5d
更新时间:2022-06-07 03:35