分析师:张青执业证书编号:S0890516100001
分析师:余景辉执业证书编号:S0890519120001
1.引言
本文是我们在分行业多因子选股策略构建方面的一次尝试。文中,我们并不追求对新潮alpha因子的挖掘,而是重点研究即便是传统Barra体系下定义的常见因子,倘若采用分行业构建的方法,是否有效。此外,本文中,为避免过度挖掘,我们在分行业选股时,并未采用申万一级或中信一级这样划分较细致的行业分类,而是采用了中信大类行业风格叠加科技行业这样的分类体系。
2.分行业选股:行业分类及单因子构建
2.1.行业分类
2.2.单因子测试
对于以上六个大类的股票,我们将用公共的因子库进行测试,选出适用于不同类别股票的因子,以下为全部因子,财务类因子包括成长、盈利等,技术类因子包括动量、流动性等。
在确定了风格因子和各自的描述性因子后,我们就需要进行单因子测试,以选取表现较好的描述性因子合并成为风格因子。为全方面反映因子绩效,我们采用回归法与分层法两类方法分别进行测试。
(1)回归法
回归法就是将因子当期值与下期股票收益率进行回归,其回归系数可看作是因子的收益率,而因子收益率本身就可以作为度量因子选股绩效的一个重要指标。为剔除行业风格对因子选股绩效的影响,我们在回归方程中加入行业虚拟变量,回归方程如下:
在回归法中,我们还会考察因子收益率t值、因子IC、IR值,因子波动率等其他指标。
(2)分层法
分层法在单因子测试中也被广泛使用。该方法将因子值从大到小排列,并划分成n档(例如n=5),将每档的股票按照一定的权重(例如等权或市值加权)方法构建组合,从而可以得到历史上各档的收益率序列及净值曲线,因子绩效主要体现于划分的各档股票组合的收益差。该方法的最大优点在于逻辑较为直观,并可以对因子选股绩效的单调性进行检验,我们将其作为回归法的补充。
在这里我们以科技类行业为例展示单因子的测试结果。
从以上测试结果可以看到,两个特质因子的表现都非常优异,其中商誉占比越低的公司表现越好,研发费用占比越高的公司表现越好。
通过综合回归法和分层法测试的结果,我们可以分别得到适用于以上6个大类行业的因子。以下为该六大类行业所选因子。
2.3.因子合成
因子合成的本质是对风格因子内部的描述性因子进行加权平均,核心在于加权方式的选择,如采用等权加权、IC加权、IR加权等。本报告中,我们尝试采用有约束的最小二乘法生成描述性因子的加权权重,这一方法的好处在于充分考虑了因子的历史绩效,因子历史选股的绩效越高,权重就越大。构建模型如下:
为避免权重过度集中于某一两个描述性因子上,在上述最优化模型中,我们加入了对因子权重的上限约束,选取等权权重下的1.3倍。此外,为避免因子权重跨期出现较大跳跃,我们采用滚动12期平均值作为最终生成的权重。
基于以上方法,我们分别对6个大类行业内所选因子进行因子合成,得到合成后的大类因子。
因子收益率具有广泛用途,不仅可以用于表征市场风格走势,还可以直接运用于多因子选股的打分排序。其基本思路为:对t+1的因子收益率进行预测,将预测值带入多元回归模型,即可生成t+1期各股票的预期收益率,即:
我们采用各因子收益率过去12期的平均值作为对的预测值,解出各股票的预期收益率,并在全市场或分行业选取预期收益率排名前10%(最少取5只)的个股作为最终筛选的股票池。我们将该方法称为因子收益率加权方法,较其他几类常用的因子权重设定方法(如等权加权、IC加权、复合IR加权等)相比,该方法的选股效果较好,多项测评指标靠前。
3.分行业选股:综合模型构建
除此之外,当前多因子选股体系,在构建初始股票池时,往往会剔除一些存在财务造假嫌疑或者财务风险较大的个股。为模拟这一操作,简便起见,我们采用每个季度主动权益型基金披露的基金重仓股作为初始股票池,其背后的逻辑是我们认为基金经理作为专业投资者,其重仓的股票,已经做了过滤,踩雷的概率相对会低一些。在此基础上,我们再按照上述方法构建组合。
从以上基于基金重仓股的回测结果可以看到,其结果相比基于全部A股的回测结果,从收益率上看差距不大,但回撤幅度也得到了控制,无论是市值加权还是等权加权,组合的Calmar比率均好于全市场选股,这说明一定程度达到了规避选股踩雷风险的目的。
4.结束语
总之,本文站在中观行业的视角,分行业构建多因子选股模型,为保证因子从逻辑和统计上都能通过检验,我们采用了全市场多因子模型中通过检验的因子作为初始因子池,并将A股标的划分成消费、周期、成长、金融、稳定以及科技这六个大类,在这六个大类内对因子进行测试并合成因子,来保证每个大类内的标的数量充足以满足统计上的检验要求。分行业多因子模型的目的更倾向于站在行业配置的视角,选出能够跑赢行业指数的标的组合,这尤其对于没有指数etf的细分行业而言更具有价值,投资者可以自行构建行业组合,来满足行业配置的需求。