因子挖掘

在金融领域,"因子挖掘"是一项关键的策略,通过对大量的、多样的数据集进行深入分析和挖掘,以识别出影响资产价格变动的主要驱动力。这些驱动力,或称“因子”,可以是宏观经济指标、市场情绪、企业基本面数据,或者是通过复杂算法从海量信息中提取的隐藏模式。 因子挖掘的过程需要借助先进的统计技术和计算能力,包括但不限于回归分析、机器学习、深度学习等。其目标是构建能够预测资产未来表现的模型,并为投资决策提供数据驱动的洞见。通过这种方式,投资者可以更加精准地把握市场趋势,优化投资组合,降低风险,并提高投资回报。 总的来说,因子挖掘是现代金融中一个不可或缺的工具,它结合了数据科学和金融学的精髓,帮助市场参与者做出更加明智和有效的决策。

基于OpenFE的期货因子挖掘

引言

在量化交易与数据科学领域,特征工程是一个至关重要的步骤,直接影响到模型的预测能力与效果。OpenFE 是一个开源的特征工程框架,旨在帮助研究人员和工程师快速生成高质量的特征。然而,原始版本的 OpenFE 算子虽然功能强大,但在某些应用场景下仍存在一定的局限性。为了更好地满足我们在量化研究中的需求,我对 OpenFE 算子进行了重新构建,丰富衍生特征生成;并将其与 XGBoost 相结合,用于特征重要性评估,方便后续标的打分。

本文将详细介绍这一重构过程,并通过实际案例展示如何使用这一改进后的算子生成衍生特征,并使用 XGBoost 进行特征重要性评估,从而优化我们的量化模型。

更新时间:2024-12-24 06:43

当深度学习遇上量化交易——因子挖掘篇

摘要

在深度学习的所有应用场景中,股价预测也无疑是其中一个异常诱人的场景。随着传统线性模型的潜力逐渐枯竭,非线性模型逐渐成为量化交易的主要探索方向,深度学习对非线性关系良好的拟合能力让其在量化交易中面临着广阔的应用前景。但与常规的回归预测任务不同的是,股价预测问题有其独特性,存在时间序列、噪声高、过拟合等问题。当前对于深度学习在股票交易中的研究主要侧重在因子挖掘、图神经网络与知识图谱、新闻与社交媒体等非结构化数据的利用、以及时序模型改进四个方面。我们会在文章中依次探讨近5年顶会上对这四个方向的研究。

本文主要介绍MSRA在KDD 2019上发表的两篇文章,这两篇文章主要关注深度学习在

更新时间:2024-12-05 06:16

79th Meetup

MeetUP直播答疑 时间:8月24日(周四)19:00 回放视频请访问宽客学院-双周答疑-79thMeetup

\

问题列表

**问题1:我主要使用价格K线形态来进行买入卖出依据,但是仅使用数学公式来描述形态(三角形,W,茶杯,头肩顶等)感觉比较局限,和难抓住我用眼睛能看到的内容(同样也表示这个东西比较主观)。能否我进行人工挑选,例如将我看到的:3月10日到5月7日XX股票是一个头肩底,将不同的形态打上不同的标签,找出成百上千个这样的形态作为训练集喂给AI,然后反过来让AI识别出过去历史上所有这些形态然后进行回测,不知这种做法是否可行,以及在代码模型

更新时间:2024-08-22 03:51

如何利用滚动回测进行策略开发和因子挖掘?

问题

如何利用滚动回测进行策略开发和因子挖掘

视频

[https://www.bilibili.com/video/BV1Gr4y177FR?share_source=copy_web&vd_source=2e7dc1240ea373ea6eba1134af8dd086](https://www.bilibili.com/video/BV1Gr4y177FR?share_source=copy_web&vd_source=2

更新时间:2024-06-07 10:55

59th Meetup

本期提问者:bq22fw19、bq61ym2n、1855680***、bqhz06vb

因子挖掘

如何利用市场信息?

利用市场信息进行量化投资主要涉及以下步骤:

  1. 数据收集:首先,需要收集和整理市场数据,包括股票价格、交易量、基本面数据、新闻、宏观经济数据等。这些信息可以从各种数据供应商或公开数据源获取。
  2. 数据预处理:对收集到的数据进行清洗和预处理,处理缺失值、异常值、重复值等,保证数据的准确性和完整性。
  3. 特征工程:根据投资策略和模型需求,进行特征工程,提取有价值的特征和信号。
  4. 模型构建:选择合适的模型(如回归模型、机器学习模型、深度学习模型

更新时间:2024-06-07 10:55

编写策略/AIStudio

简单介绍

AIStudio是BigQuant平台以AI为核心的Cloud IDE,可以用于量化投资数据分析、因子挖掘、模型训练、回测和交易以及更广泛的程序开发和AI模型开发训练等。


快速入门

启动AIStudio

点击顶部导航栏中的【编写策略】即可启动AIStudio,或点击AIStudio超链接直接跳转。

初次启动可能需要一些时间,请耐心等待。

启动过程中可以点击"签到领宽币",获得50宽币的奖励。


![加载页面](/wiki

更新时间:2024-05-22 15:05

gplearn入门

gplearn核心概念

它是一个基于Python的库,旨在通过遗传编程(Genetic Programming, GP)实现机器学习的功能。遗传编程是一种自动化的机器学习方法,通过模拟达尔文的自然选择理论来解决问题。它属于遗传算法的一种,通过选择、交叉(杂交)、变异等操作对程序(个体)进行迭代,以产生更好的解决方案。gplearn主要用于回归和符号回归任务,可以自动生成解决特定问题的数学模型或符号表达式。它的灵感来自于 scikit-learn,可以用于自动化发现数据中的关系,创建复杂的模型或因子。在金融领域,gplearn可以用于因子挖掘,帮助发现影响股票价格

更新时间:2024-05-20 03:04

【历史文档】高阶技巧-开箱实盘即用,批量测试因子的实盘策略模板

更新

本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明

新版量化开发IDE(AIStudio):

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略:

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间:2024-05-16 03:41

遗传因子

我用遗传规划 挖觉的因子 是product(return_0, 3) 还是(return_0, 3) 这个product是什么意思

\

更新时间:2023-10-09 02:22

了解AIStudio

AIStudio是BigQuant平台以AI为核心的Cloud IDE,可以用于量化投资数据分析、因子挖掘、模型训练、回测和交易,以及更广泛的程序开发和AI模型开发训练等。

/wiki/static/upload/31/315c1087-6d07-491a-90ef-43e717997077.mp4

从这里开始

关键概念

\

更新时间:2023-09-07 03:12

【参赛】Deep Alpha-CNN策略克隆&调参擂台赛

\

更新时间:2023-06-27 03:23

基于基因表达式规划的价量因子挖掘-天风证券-20200220

摘要

因表达式规划下的价量因子挖掘

多因子模型能够持续改进的核心是持续有效地发现有显著选股能力的因子。基因表达式规划是一种启发式算法,其借鉴生物基因进化的思想,能够通过不断变异与进化来发现更好的解。因此,本报告中我们基于基因表达式规划来挖掘有效的价量因子。

在短周期价量数据构造的因子中,大部分因子选股效果的单调性并不显著,还有很多因子的多头没有超额收益,因此在设置因子有效性筛选指标时,我们结合了因子的ICIR、多头超额收益以及分组收益的单调性,综合考察因子的选股效果,实际挖掘出的因也具有较为单调和显著的选股效果。

基于挖掘因子构建指数增强组合

我们将挖掘得到的周

更新时间:2023-06-01 14:28

基于遗传规划算法的alpha101再扩展:交易型量价因子挖掘与有效性研究-申万宏源-20200417

摘要

本文第一部分对alpha101因子在A股市场有效性和相关性进行探讨,筛选出有效性、独立性均较强的alpha因子作为基础量价因子库;第二部分,基于遗传规划算法进行交易型量价因子再挖掘,对基本算子进行组合重构,使因子风格中性化后仍具有较强有效性。

对alpha101因子构建方法进行解析,并检验因子有效性和相关性。结果显示,因子具有较强有效性,从Rank_IC、分层效果、组合收益等角度筛选,22个因子在周度频率上表现较好,11个因子在月度频率上表现较好,有效因子整体表现出较高收益率,但是在2017年均出现不同幅度回撤;因子相关性方面,alpha因子值截面相关性较低,此外,alpha因

更新时间:2023-06-01 14:28

“逐鹿”Alpha 专题报告--基于openFE的基本面因子挖掘框架

重要提示:通过本订阅号发布的观点和信息仅供中信建投证券股份有限公司(下称“中信建投”)客户中符合《证券期货投资者适当性管理办法》规定的机构类专业投资者参考。因本订阅号暂时无法设置访问限制,若您并非中信建投客户中的机构类专业投资者,为控制投资风险,请您请取消关注,请勿订阅、接收或使用本订阅号中的任何信息。对由此给您造成的不便表示诚挚歉意,感谢您的理解与配合!

核心结论

本文介绍了一种基于openFE的基本面因子挖掘方法,将三大报表的数据以及基础算子之间按照一定的结构进行排列组合,构建出70万个不同风格类型的因子,再利用openFE的两步筛选法,筛选出不同风格类型下表现最好的合成因子。

更新时间:2023-06-01 14:28

再探基于遗传规划的选股因子挖掘 华泰证券-20190807

摘要

本文对遗传规划提出了三个改进方向,进一步提升其因子挖掘能力本文是对华泰金工前期报告《基于遗传规划的选股因子挖掘》(2019.6)的补充和改进,目的是进一步提升遗传规划挖掘选股因子的能力。本文提出并测试了 3 个改进方向:(1)新的适应度指标——因子互信息和多头超额收益;(2)非线性因子的使用方法;(3)交叉验证控制过拟合。测试中展示了20 多个挖掘出的选股因子供投资者参考。通过方法论的介绍,本文旨在说明遗传规划或许能挖掘出大量因子(尤其是非线性因子),这对于能够利用非线性因子的机器学习选股模型来说具有重要意义。

改进方向1

新的适应度指标——因子互信息和多头

更新时间:2023-06-01 14:28

基于遗传规划的选股因子挖掘 华泰证券-20190610

发布时间:2019年6月10日

研究团队:华泰金融工程

研究员:林晓明S0570516010001、陈烨S0570518080004

核心观点

本文通过原理分析和系统测试,介绍了遗传规划在选股因子挖掘中的应用 遗传规划是一种启发式的公式演化技术,通过模拟自然界中遗传进化的过程来逐渐生成契合特定目标的公式群体,适合进行特征工程。将遗传规划运用于选股因子挖掘时,可以充分利用计算机的强大算力,同时突破人类的思维局限,挖掘出某些隐藏的、难以通过人脑构建的因子。本文介绍了遗传规划应用的完整流程,对遗传规划程序包gplearn进行了深度定制改进。测试结果显示,遗传规划能从有限的量价数据中挖掘

更新时间:2023-06-01 14:28

机器因子库相对人工因子库的增量

研究结论

国内量化发展已有十余年,各家机构投资者的Alpha因子库已有较大规模,这时面临的问题是,继续花时间和精力进行因子挖掘扩充因子库是否划算,还能带来多少增量收益。我们尝试将近年来兴起的机器学习算法应用到Alpha模型上,进行低频层面的因子挖掘,考察机器因子库相对人工因子库的增量

本文首先利用遗传规划算法进行因子挖掘,再将机器因子库与人工因子库通过随机森林模型转换为预测收益率,从组合层面进行因子库效果的整体比较。考虑到技术类因子和财务类因子历史表现差别较大,我们将这两类因子的挖掘和对比分开进行

遗传规划是一种启发式的进化策略算法,可以用来进行选股因子挖掘。遗传规划算法的主要想法

更新时间:2023-06-01 14:28

因子挖掘

问题

请问下bq平台用哪个包做因子挖掘?pip list不能运行,也看不到有哪个包,麻烦指下路,多谢!

解答

您指的因子挖掘具体使用的算法是什么呢?这边可以和您具体沟通下。像遗传算法做因子挖掘平台都是有集成的。

你想安装什么包呢?可以给我们反馈,后续可以支持。

更新时间:2023-06-01 14:26

挖掘因子怎么跟策略结合

问题

挖掘因子怎么跟策略结合

https://bigquant.com/experimentshare/6a4a127545324887991901950c5f3a23

\

更新时间:2023-06-01 14:26

遗传规划疑问

问题

遗传规划我加上了选股条件进行因子挖掘,日志中pass指验证通过的因子数量,为何我

m1.factors.read() 取值是空,是否是因为我加了筛选条件有问题

如下图,测试集中有适应度为2的因子, \n {w:100}

[https://bigquant.com/experimentshare/fff6b8873da540a08a3da4889f1c0566](https://bigquant.com/experiments

更新时间:2023-06-01 02:13

基于逐笔成交数据的高频因子梳理-海通证券-20200223

摘要

在系列专题报告《选股因子系列研究(五十六)——买卖单数据中的Alpha》、《选股因子系列研究(五十七)——基于主动买入行为的选股因子》、《选股因子系列研究(五十八)——知情交易与主买主卖》中,我们从不同的角度对于逐笔成交数据中的信息进行了挖掘,并得到了一些具有显著选股能力的因子。本文旨在对于筛选得到的有效因子进行梳理。逐笔因子在正交后具有显著的全市场月度选股能力。因子月均IC在0.03~0.04之间。正交后的各逐笔因子皆呈现出了较强的稳定性。除了买单集中度之外,其余因子年化ICIR皆超过2.0。

指数范围会对因子选股能力产生影响。在中证800指数内,大买成交金额占比、盘中主

更新时间:2022-09-01 13:34

抽丝剥茧 去芜存菁:水晶球择时模型之 3.0 兴业证券20180926

摘要

期权作为现货的衍生产品,其交易情况暗含了投资者对市场的观点,期权交易日益活跃,可以从中获得有效且领先于现货市场的信息,兴业水晶球策略于2015年中推出,至今已有三年多样本外数据,其致力于挖掘期权市场中符合经济学逻辑且统计规律显著的因子,对期权标的现货(50ETF)进行短期的预测,无论是策略的整体表现,还是在历次市场拐点的判断上,都非常优秀。

目前上证50ETF期权的主要投资群体是通过考试的专业投资者,具有一定的前瞻性,他们对现货的未来走势预期可能相对会更加准确。如果能够充分地挖掘这部分投资者的情绪,就可以利用从期权中获得的信息对现货进行择时,这也是水晶球择时的基本逻辑。

更新时间:2022-08-31 07:31

基于遗传规划的选股因子挖掘 (副本)

发布时间:2019年6月10日

研究团队:华泰金融工程

研究员:林晓明S0570516010001、陈烨S0570518080004

核心观点

本文通过原理分析和系统测试,介绍了遗传规划在选股因子挖掘中的应用 ====遗传规划是一种启发式的公式演化技术,通过模拟自然界中遗传进化的过程来逐渐生成契合特定目标的公式群体,适合进行特征工程。将遗传规划运用于选股因子挖掘时,可以充分利用计算机的强大算力,同时突破人类的思维局限,挖掘出某些隐藏的、难以通过人脑构建的因子==。==本文介绍了遗传规划应用的完整流程,对遗传规划程序包gplearn进行了深度定制改进。测试结果显示,==遗传规划能从

更新时间:2022-08-30 10:52

宽邦科技受邀华泰量化研究5周年,分享《 量化选股中Al算法应用最佳实践》

人工智能在量化投资领域已有哪些应用实践?

未来发展将走向何方?

模型测试、因子挖掘、另类数据、对抗过拟合、生成对抗网络以及其他综合领域,有何前沿成果?

6月6日(周一)-6月10日(周五),“华泰人工智能量化研究5周年论坛”,2天主论坛与6场主题分论坛,连续5天,与您聊聊人工智能量化研究的前沿内容。

宽邦科技首席策略官 邵守田受邀,与您于16∶05-16∶35聊聊《 量化选股中Al算法应用最佳实践》。

参与方式:

行知App全程直播

扫描下方二维码直达 ![{w:100}{w:100}](/wiki/api/attachments.redirect?id=e5d

更新时间:2022-06-07 03:35

分页第1页
{link}