因子投研中的风格偏向及因子风格分析框架
由bqgl97s8创建,最终由bqgl97s8 被浏览 26 用户
因子应用时应注意穿透真实风格
老韵前段时间分享了因子批量测试的工具,见《因子研究工具:批量因子测评,自适应多空方向》。当我们测试到一些数据特别好的因子时,是不是就迫不及待地去想使用?
以下为cn_stock_factors_hf库里近6年的测试结果,年化收益率排前的数据确实喜人,你会发现这些成绩都超过绝大多数常规因子与高频因子。
那这里面又是有什么魔法吗?先别高兴太早!其实我们看特大单卖出金额,它是一个绝对金额,那么什么样的股票这个金额会大?豪无疑问,至少得是大市值的股票。这个指标是负向的,所以穿透其真实属性,其实就决定了它必然就是小市值策略;只是说,还包含了所谓大单的数据信息。那么,在这相当长时间近十年小市值都表现非常突出的情况下,其他信息带来的区别就已经可以忽略了,这也是为什么大单买入金额与大单卖出金额,在买卖两个性质完全相反的指标,其表现是同向的且年化回报和夏普都惊人一致的原因:不是因为是否是买还是卖,也不在乎是大单的还是特大单还是中单甚至小单,而是这个金额本身,与其股票的市值大小是高度相关的!
因子投研中应特别重视分格特性
同样,在因子投研中,要特别注意风格的偏向。当我们魔改一类因子时,一定要注意风格的影响,不要看到某个特征的收益率高就改过去,也许就丢失了那些独立风格的更宝贵的特征。比如,在曹春晓老师分享的滴水穿石因子一文中(原文链接),相关性如下:
可以看出,其与流动性相关性最高,与市值相关性不算太高。但是,如果我们对它进行魔改——
这里举例我用cowork辅助进行的第二轮魔改(m3版本)。其魔改思路:
🚀 三大核心创新 创新1: MAD裁剪 + 自适应阈值
创新2: 买卖方向分离
分别构建买卖方向的周期波动以及买卖力量对比
创新3: 量价协同周期性
另外再加上第二版有效的盘口冲击,大单持续性两个子因子,构成一个非常复杂的综合因子,最高可将原约27%的年化提升到36%。但是!一测相关度,其中四个子因子市值相关度都非常高,导致综合因子对市值相关度也非常高:
这个与市值相关度超过0.5的因子,与原来市值相关性(绝对值)16.6%相差太远,显然不是我所要的。
让我们来看看市值风格是怎样混入的?我让cowork分析如下:
大盘股:
- 机构主导 → VWAP算法 → 规律性交易
- 成交量有周期性脉冲 →
wavelet_energy高 - 因子值 = 标准化后的值 → 高
小盘股:
-
散户/游资主导 → 随机交易
-
成交量无规律 →
wavelet_energy低 -
因子值 = 标准化后的值 → 低
\
当然,这个解释还有些牵强,但魔改买卖分离、上涨下跌分离后,相关指标带上了更强的市值特征是豪无疑问的。但是呢,也还有很中性化的几个分支因子:买卖力量对比,量价同步性,盘口冲击,大单持续性。事实上,如果我去掉或只小权重的加入强市值特征,以偏中性化的子因子为主,还是能构筑很强悍的综合因子的:年化0.3344,比原来有20%+的提升。更重要的是,它的市值相关度(绝对值)已经到了12.9%,比原始因子更小,流动性风格也由原来的34%降到了17.2%,豪无疑问,这已经是一个相对全新的因子了。
\
因子分格分析框架(代码)
最后,分享由老韵出主意,cowork辅助生成的因子风格分析框架:
https://bigquant.com/codesharev3/8457a39a-45a3-4af8-bb38-c00f068c4868
\