机器学习问题和其流程
机器学习问题本质上在于找出使得经验风险泛函(样本误差)最小的建模流程,基本的流程可以分为特征工程、模型训练和模型融合。本篇就上述三个过程,给出相关算法的介绍,并补充了之前系列报告中未详细介绍的内
机器学习三大步骤
特征工程包含特征构建、特征提取和特征选择三个过程,以选择相对最优的特征空间。特征工程往往会采用无监督和有监督的机器学习算法。机器学习模型可以分为线性模型、树模型和深度学习模型。线性模型主要体现了数据中的线性关系,如输入与输出的线性关系,点集的线性可分;树模型可以很好的捕捉输入与输出的非线性关系,和线性模型相辅相成。一些改进的随
更新时间:2022-08-31 01:53
机器学习系列报告
本系列报告试图系统全面性的介绍各种不同的机器学习方法,并且结合具体的在投资研究领域应用实例、交易策略及code示例,说明其应用情景和实现方法。机器学习的方法可以分为以下几类:监督学习、无监督学习、深度学习及其他机器学习方法(例如强化学习),对应到具体的模型上数量则更是繁多,目前大部分机器学习模型并未广泛的应用在投研领域,因此本系列主要偏重于在投研领域有应用潜力的模型及方法。此篇将以介绍监督学习方法为主
监督学习模型之回归类模型及其应用
与普通线性回归不同,监督学习中的惩罚回归模型和非参数回归,可以分别用于处理输入变量中存在大量线性相关性关系
更新时间:2022-08-31 01:52
更新时间:2022-05-22 01:17
更新时间:2022-04-21 06:21
更新时间:2022-04-11 11:00
更新时间:2021-11-12 11:39
更新时间:2021-09-08 03:03

作者:James Le 编译:caoxiyang
在机器学习中,有一个叫做“世上没有免费午餐”的定理(NFL)。简而言之,我们无法找到一个放之四海而皆准的最优方案,这一点对于监督学习(即预测建模)尤为重要。例如,你不能说神经网络总是比决策树好,反之亦然。因为其中有很多因素在起作用,比如数据集的大小和结构。
因此,您应该针对您的问题尝试多种不同的算法,同时,保留一组数据,即“测试集”来评估性能并选
更新时间:2021-08-24 05:46
\
更新时间:2021-08-23 01:56
更新时间:2021-07-30 09:11
更新时间:2021-07-30 08:10
本代码完整版一共包括三部分:数据、算法、回测交易。 由于该策略与机构有一些合作,我们只放出了数据和算法。希望大家能够理解!
https://bigquant.com/experimentshare/5a93201876eb401e998867e0b5106175
\
更新时间:2021-07-30 08:09
更新时间:2021-07-30 07:26