BigQuant使用文档

因子常见处理方式

由qxiao创建,最终由qxiao 被浏览 9 用户

本文介绍量化因子三种常见的处理方式,分别为:

  • 标准化处理
  • 极值处理
  • 中性化处理

这三种数据处理方式,都是截面处理,即当天全市场5000之票做预处理,不涉及时序数据。

标准化处理

把当天的因子值按均值为0,标准差为1进行标准化处理

c_normalize(mkt) as score1

\

极值处理

其实就是把分位数较大和较小的因子按分位数的因子值做截断处理

c_winsorize(score1, 0.01, 0.99) as score2

中性化处理

剔除市值和行业影响,当天全市场数据做回归取残差

c_neutralize(score2, sw2021_level1, float_market_cap) as score


参考代码如下:

https://bigquant.com/codesharev3/a5cccd00-a236-4b65-81b9-0eed5eeef01d


\

标签

量化因子数据处理
{link}