机器学习

机器学习在金融领域的应用日益广泛，为金融业务的智能化提供了强大动力。它运用算法和模型，自动从海量数据中学习和提取有用信息，无需人工进行复杂编程。在金融风控方面，机器学习技术可帮助银行、保险公司等机构更准确地识别欺诈行为，降低信贷风险。在投资策略上，通过对历史数据的深度学习，机器能预测市场走势，为投资者提供更精准的建议。同时，机器学习还能优化客户服务，例如通过聊天机器人提供24小时在线咨询，或根据客户行为数据提供个性化金融产品推荐。总的来说，机器学习不仅提升了金融业的效率和智能化水平，也在重塑我们的金融生态。

机器学习与深度学习

传统的量化投资主要依赖于金融时间序列分析、统计学和经济学原理来构建模型。然而，金融市场是复杂、非线性、高噪声的动态系统，传统的线性模型在处理海量、高维和非结构化数据时常常力不从心。

机器学习和深度学习技术的崛起，为量化投资带来了革命性的工具。它们能够从海量数据中自动挖掘复杂的非线性模式，极大地扩展了量化策略的广度和深度。

【视频1】

video(19).mp4 165970555

【视频2】

[https://bigqu

更新时间：2025-11-27 10:19

机器学习策略综合实践

在当今信息爆炸的时代，金融市场充满了海量、高维、非结构化的数据。传统投资方法在处理这些复杂数据时常常力不从心。

而人工智能，特别是机器学习 和强化学习，正以其强大的数据挖掘和决策优化能力，为投资领域带来革命性的变化。

其核心思想可以概括为：利用“机器学习”从浩瀚股海中精准筛选出有潜力的股票（选股），再运用“强化学习”为这些股票寻找最佳的买卖时机（择时），从而构建一个全自动、高适应性的智能投资系统。

[https://bigquant.com/bigapis/college/v1/files/88c8f449-ccc4-4bd8-834c-4ac

更新时间：2025-11-27 10:14

策略分享-时间序列分析风格判断

《韩非子 · 五蠹》有言：“世异则事异，事异则备变”。

我们过去的策略对市场风格进行判断时，除了一些绝对化标准的方法，还介绍过用机器学习算法来学习市场风格变化的模式。但是，如果将这种风格判断应用在一些中短期策略上，可能会带来以下的问题：

（1）A 股短期波动中，突发消息（如政策微调、资金异动、情绪恐慌）的影响远大于 “可预测规律”。

（2）机器学习依赖 “特征工程”（如成交量、资金流向、行业涨跌幅等），但中短期维度下，这些特征与指数收益率的相关性极不稳定。

（3）A股各种指标特征的特点变化极大，用过去一年两年的数据进行数据很可能会匹配不上现在的行情。

那么对于中短

更新时间：2025-11-17 02:01

什么是量化投资

70年代，随着计算机技术的快速发展，量化投资开始迅速崛起，计算机的广泛应用使得大量历史数据的存储和处理成为可能，从而促进了量化分析方法在投资决策中的应用。

此时期，许多基于统计和数学模型的量化策略被开发出来，如指数化投资、算法交易等。

进入21世纪，量化投资经历了爆炸式的增长，数据的爆炸增长和机器学习技术的进步为量化投资提供了新的工具，机器学习和人工智能技术使得量化投资策略能够从大量复杂数据中提取模式，并进行更为精细的市场预测。

[Screen-2025-11-06-225619.mp4 202738252](/wiki/static/upload/42/42f033

更新时间：2025-11-13 06:36

提交代码后不出结果的几个可能原因(会实时更新)

大家在提交之前务必要在cpt_jyc_2025_stock_csi1000_bar1m上使用因子分析工具来查看。如果在该数据集上无法展示因子分析绩效, 那么提交后也不会产生分数!

机器学习模型训练失败

经过这几天的跟踪, 有一部分的比例是因为使用了机器学习模型导致无法出得分, 此时需要各位检查一下机器学习是否预测成功。可能存在以下原因导致无法出结果:

训练数据中存在缺失值导致损失为NaN:

针对这种情况，请大家

更新时间：2025-10-17 08:25

邹的作业

先感谢老韵同学，下面抄老韵同学的作业，改了3个模型进行训练，不知道为啥我这里xgboots的效果那么差，搞不清原因。感觉机器学习最重要的就是设置好因子和lable，目前没有头绪，没有对因子挖掘系统性的认知，现在就是瞎试。之前lable没有用pct_rank_by，结果就很差，不知道如何运用pct_rank_by和pct_rank_by提升收益的逻辑，还请答疑时，老师给解答一下。

[https://bigquant.com/codesharev3/cec871c2-b428-451c-8c70-cfd4a6d1c2f9](https://bigquant.c

更新时间：2025-08-16 15:23

张伟_作业

以下是机器学习的作业，分别测试了XGBoost模型和线性回归模型，代码如下：

https://bigquant.com/codesharev3/9f8b0f0d-a863-4f0c-ab89-2508ca68d72b

一、XGBoost模型构建主要思路

1.股票池选择

策略获取盈利主要还是从优质微盘股风格中获取，因此在股票底池做如下限制：（1）pe_ttm大于0；（2）市值排名最小的20%；（3）剔除ST股及停牌股

更新时间：2025-08-12 09:54

策略分享-基于CatBoost模型与分类任务的ETF选基策略

0. 策略名词解释

（1）CatBoost模型

CatBoost 是由 Yandex（俄罗斯的一家互联网公司） 开发的一个 基于梯度提升（Gradient Boosting） 的机器学习库，主要用于 分类、回归、排序任务，以处理结构化数据为主。它的名字来自 “Category Boosting”，因为它特别擅长处理 类别特征（Categorical Features）。本策略中使用的是分类任务（二分类）。

在bigquant平台的可视化模块中暂时不支持

（2）分类任务

分类任务是指将输入数据划分到预定义的类别中。在 CatB

更新时间：2025-08-12 02:08

喜澄的作业

按照本次作业要求，我根据笑宇老师的讲解及给的模版，借住AI编程，分了几个步骤，完成作业如下：

1、先根据之前老师的讲解，选择小市值因子、换手率因子等有效因子，构建策略因子组合，时间关系选了4个，后续可以用老师讲解的因子分析表替换可能的有效因子\n2、基于笑宇老师给的模版，运用AI完成线性回归策略，几经周折，跑通策略；\n3、将策略打包成模块，将可用的3个模型作为参数，构建多因子多模型策略，跑通；\n4、将策略输出用图表展示出来。前后整了3天，修改了10几个版本才成型，累得够呛，但最终跑通还是欣慰的\n\n学习心得：\n1、因子重要还是模型重要？\n我的理解是二者都很重要，但因子相对更重要。从

更新时间：2025-08-11 08:58

陈雨作业，0729

1、请回顾你过去的交易经验，选择一个你曾经使用过的交易方法，尝试用量化的方式重新表达出来（用文字描述，无需代码实现）

 优选2-3个近期热点行业筹码峰低位集中的2-3之股票。最好是看的出来主力持仓开始集中了。
 量化表达：

 (一)定义板块动量因子确定热门板块

 (二)定义股票动量因子确定热门板块中的热点票，并通过量价关系因子过滤出股票

(三)通过机器学习，选取股票，形成策略。

2、在看完从0-1开发量化策略之后，请自己总结一下量化策略开发的主要流程

主要流程包括：

A想：先找到逻辑把任何能解释价格变动的灵感（经典理论、市场现象）翻译成一句可证伪的假设。例如“高动

更新时间：2025-08-10 07:19

bqcj06gr_作业提交

1、请回顾你过去的交易经验，选择一个你曾经使用过的交易方法，尝试用量化的方式重新表达出来（用文字描述，无需代码实现）。

答:股票池筛选:当连续10日最小值大于34日均线的0.99倍时纳入初选股票池;若获利筹码高于73%，则买入；当最大值低于34日均线时卖出。

2、在看完从0-1开发量化策略之后，请自己总结一下量化策略开发的主要流程。

答:1、进行单因子分析筛选出IC和IC_IR较高的因子,积累初步的因子库;

2、对有效的因子进行单因子选股回测，看看初步效果，确定哪些因子是核心收益率因子，哪些可用于控制风险，并对这些有效因子进行相关性分析；

3、选择前面有效的收益因子进行机器学习或

更新时间：2025-07-29 09:40

Liujunze_作业提交

【今日作业】：

1、请用自己的话解释什么是量化投资。

量化投资就是找出收益率与某个参数存在关系，然后用历史的数据来证实这个关系，最后是用近期参数的变化来找出收益率高的股票。

在这个过程中：

收益率就是未来的的收益，各有各的定义，有些用三天，有些用五天

某个参数，简单来说可以是开盘价、收盘价这些单个因子，也可以是单个因子之间所形成的公式组

关系，就是趋向于线性关系，参数上涨/下跌时，收益率大概率也跟着一起；

       非线性关系，就是通过复杂的机器算法来找出参数内高收益的部分，自学习两者关系，然后用它预测未来收益。

历史数据：就是用发现的关系，在已经过去的数据，来进行

更新时间：2025-07-28 10:22

策略分享-基于随机森林的半自动量价多因子策略

0.策略名词解释

0.1 随机森林

随机森林是以决策树为基学习器的集成学习算法。随机森林非常简单，易于实现，计算开销也很小，更令人惊奇的是它在分类和回归上表现出了十分惊人的性能。

1、用有抽样放回的方法（bugging）从样本集中选取n个样本作为一个训练集

2、用抽样得到的样本集生成一棵决策树。在生成数的每一个结点：

随机不重复地选择d个特征
利用这d个特征分别对样本集进行划分，找到最佳的划分特征

3、重复步骤1到步骤2共k次，k即为随机森林中决策树的个数。

4、用训练得到的随机森林对测试样本进行预测，并用票选法决定预测的结果。

下图比较直观地展示了随机森林算

更新时间：2025-06-27 07:43

使用M.tune写一个超参优化

本文是旧文，最佳实践见：160-alpha挖掘大杀器——并行模块tune

前言

M.tune可调节的参数仅限于模块中的参数, 具体用法可参考**尝试用M.tune写一个滚动训练.**

使用方法

我们创建一个机器学习算法策略, 将可视化画布转化为代码形式:

![](/wiki/api/attachments.redirect?id=bcfc8a07-292d-4319-9143-42

更新时间：2025-06-09 05:53

埃及和金砖国家双边贸易的决定因素：使用传统计量经济学和机器学习算法的引力模型

摘要

文章首先介绍了国际贸易的基本概念，包括进口和出口的定义，以及国际贸易的起源和重要性。文章提到，由于各国资源分配不均，国际贸易成为满足国内需求的重要手段。文章还回顾了国际贸易理论的发展，从亚当·斯密的绝对优势理论、大卫·李嘉图的比较优势理论，到赫克歇尔-俄林模型和克鲁格曼的新贸易理论。这些理论为理解国际贸易的模式和影响因素提供了基础。

研究方法

研究采用了以下方法：

**泊松牛顿-拉夫森方法：**这是一种经典的计量经济学方法，用于分析贸易量与各种因素之间的相关性。
**梯度提升（GB）和随机森林（RF）：**这两种机器学习算法用于识别对贸易量有显著影响的独

更新时间：2025-05-12 09:57

机器学习应用于底部反转策略的表现

策略简介

A股表现整体呈现震荡趋势，熊市周期长，且经常出现虽然指数跌幅较低，但市场上的个股跌幅较大。于是提出猜想：是否能找到比较抗跌的策略，在市场表现一般的时候策略回测较小。

策略的特点：在大盘下跌时，策略相对大盘比较抗跌，策略回撤相对小。

构建步骤

确定策略目标市场

策略的目标市场：中小板（波动率高，活跃度高，流动率高，做出alpha可能性高；且在反转时，上涨的幅度较大）

构建策略核心因子

2个技术指标因子+1个换手率因子+1个资金流因子+1个量价因子

![](/wiki/api/attachments.redirect?id=5fbec9e0-

更新时间：2025-04-18 10:11

机器学习常见算法

导语

机器学习里面究竟有多少经典的算法呢？本文简要介绍一下机器学习中的常用算法。这部分介绍的重点是这些方法内涵的思想，数学与实践细节不会在这讨论。

回归算法

在大部分机器学习课程中，回归算法都是介绍的第一个算法。原因有两个：一.回归算法比较简单，介绍它可以让人平滑地从统计学迁移到机器学习中。二.回归算法是后面若干强大算法的基石，如果不理解回归算法，无法学习那些强大的算法。回归算法有两个重要的子类：即 线性回归 和 逻辑回归 。

线性回归就是我们前面说过的房价求解问题。如何拟合出一条直线最佳匹配我所有的数据？一般使用“最小二乘法”来求解。“最小二乘法”的思想是

更新时间：2025-04-14 04:26

用于股市预测的人工智能和机器学习的进步：技术和案例研究的全面分析

摘要

股市预测是一个经典但具有挑战性的问题，吸引了经济学家和计算机科学家的关注。交易活动涉及高风险，投资者可能会损失部分或全部投资金额，因此需要更智能的技术来辅助投资决策。

除了传统的金融数据，如价格和交易量，文本数据（如新闻和社交媒体）和宏观经济数据（如GDP和CPI）也可用于预测。这些数据类型可以提供历史数据中不存在的有用信息。

研究方法

文章详细介绍了以下几种用于股市预测的机器学习算法：

1.支持向量机（SVM）：用于回归和分类问题，通过核技巧方法转换数据，寻找最佳边界。

2.随机森林（RF）：由多个决策树组成，通过聚合预测结果来提高准确性。

3.K最近邻

更新时间：2025-04-03 03:41

使用机器学习技术对配对交易的最佳再平衡频率进行分类

研究背景

文章从现代投资组合理论出发，强调了通过多样化投资来优化风险和收益的重要性。再平衡（PR）是维持投资组合风险收益特征的关键策略，通过定期调整资产权重来应对市场变化。再平衡的频率（ORF）是一个关键参数，因为它直接影响交易成本和投资组合的灵活性。文章指出，频繁再平衡会增加交易成本，而过少再平衡则可能导致投资组合无法适应经济变化。因此，找到合适的再平衡频率至关重要。

研究方法

研究使用了机器学习（ML）技术来预测最佳再平衡频率（ORF）。具体步骤如下：

**1.数据集：**研究使用了2022年和2023年来自Binance交易所的50种加密资产的高频（每分钟）价格数据。

更新时间：2025-03-10 07:24

通过机器学习和深度学习模型增强股票市场预测

1. 文章背景

股票市场预测对于投资者来说至关重要，但由于市场的高度波动性、不确定性和复杂性，这一任务极具挑战性。近年来，机器学习（ML）和深度学习（DL）算法在处理大规模数据和复杂关系方面展现出巨大潜力，能够识别传统方法可能遗漏的模式和趋势。因此，本文旨在比较不同ML和DL模型在股票市场预测中的表现，并探讨它们在金融决策中的应用潜力。