股票多因子模型的判断及其梳理步骤
股票多因子模型,在量化交易中,多因素策略是一种经常被提及和广泛使用的选股策略,我们经常用某个指标或多种指标来筛选股票池,这些用于选股的指标一般称为因子。也即使多因素模型是指利用多种因素,综合考虑各种因素建立的选股模型,它假设可以用一组共同因素和单个股票特有因素来解释。
多因素模型的优势在于可以通过有限的共同因素有效筛选出大量的股票,大大降低了问题的难度,通过合理的预测做出判断。
股票多因子模型的判断及其梳理步骤
数据预处理
在构建多因子模型之前,要准备好待测的原始因子池及其数据,按照要求进行初步整理。
基本数据收集
作为建立模型的第一步,保证所用数据的全面性和合理性非常重要,需要归纳出不同风格的因素类型,然后将各风格类别下的相关因素进行细分,综合经济意义和相关参数确定因素的计算方法。
风格因素意味着这种因素有着独特的整体表现。按照Barra的定义,可以分为9类,分别是Beta、动量、规模、盈利能力、波动性、成长性、价值、杠杆和流动性。每个主要类别中还有细分因素。
离群值处理
在标准化数据之前,我们需要处理异群值,因为过大或过小的数据都可能影响分析结果,特别是在做回归时,异常值会严重影响因子与收益率之间的相关估计结果。看完多因子,这里还有一篇点击进行阅读吧。
通过将异常值调整到上限和下限来处理异常值,并且通过判断异常值的标准来给出其中的上限和下限。判断异常值的标准有三种,即MAD、3σ和百分位法。主要思想是先定义上下限,然后将超出上限的异常值调整到上下限。常用的是MAD法。
数据标准化
即使它们属于相同的样式因子,每个细分因子的大小和单位也可能有很大的不同,为了更好地比较和回归这些因素,我们需要对这些因素进行标准化。
标准化在统计学中有一系列的含义,一般采用z评分法,处理后的数据由量纲转换为无量纲,使数据更具集中,性或能对不同指标进行比较和回归。
如果想要知道更多关于股票的知识,或者是对股票那方main有问题想要咨询的,都可以点击与我们进行过沟通,欢迎您的咨询。