因子常见处理方式
由qxiao创建,最终由qxiao 被浏览 9 用户
本文介绍量化因子三种常见的处理方式,分别为:
- 标准化处理
- 极值处理
- 中性化处理
这三种数据处理方式,都是截面处理,即当天全市场5000之票做预处理,不涉及时序数据。
标准化处理
把当天的因子值按均值为0,标准差为1进行标准化处理
c_normalize(mkt) as score1
\
极值处理
其实就是把分位数较大和较小的因子按分位数的因子值做截断处理
c_winsorize(score1, 0.01, 0.99) as score2
中性化处理
剔除市值和行业影响,当天全市场数据做回归取残差
c_neutralize(score2, sw2021_level1, float_market_cap) as score
参考代码如下:
https://bigquant.com/codesharev3/a5cccd00-a236-4b65-81b9-0eed5eeef01d
\