景气度抬升中的机会:汽车行业景气度构建与应用——汽车行业基本面量化系列报告之二
来源:华宝财富魔方
汽车行业属于可选消费行业, 对国民经济的发展意义重大,是关系国计民生的重要行业。我国的汽车行业自加入WTO以来获得了长足的发展,但相比于国外的汽车巨头在研究创新方面仍有不小差距。近年以来随着新能源车的兴起,以及智能驾驶、无人驾驶和车联网等技术逐步发展成熟,传统的汽车行业将发生重大变化,而行业变革的同时也孕育着新的投资机会。
本系列文章拟从汽车产业链、汽车景气时钟、汽车景气度和行业内选股等角度出发对汽车行业进行深入研究。本文是系列文章第二篇,重点回答以下几个问题:1、汽车行业景气度代理变量有哪些?2、景气度代理变量的前瞻指标?3、如何预测景气度,或者如何构建景气度指数? 4、根据预测的销量和库存增速数据构建景气时钟轮动策略是否有效?
下面我们就如何预测汽车景气度进行探讨,包括景气度代理变量、景气度关联指标、景气度前瞻变量以及领先阶数、景气度的构建或者预测。通过预测得到的汽车行业超额收益以及汽车销量和库存数据,我们可以实时划分汽车周期,再根据划分的汽车周期判断未来一个月是否配置汽车行业,进而构建出交易策略。
1. 汽车行业景气度
1.1. 景气度代理变量与关联指标
景气度作为观测行业景气或者衰退的核心变量在行业研究中占有重要地位。我们从汽车行业中观数据以及宏观经济指标入手罗列了汽车景气度相关变量。汽车行业的中观层面数据涵盖价格、产量、销量、库存和保有量等。宏观经济数据则涵盖了经济增长、通胀、货币、利率和外汇等。汽车行业中观数据具有内生特征,属于纯粹经济因素影响而自行变化的变量。而宏观经济数据则往往带有外生特性,通过经济大环境变化影响或者决定社会消费环境、社会消费倾向和社会消费能力等,从而影响到汽车终端的需求,更进一步的,从需求端出发将影响扩展到汽车的整个产业链生产过程,对汽车的下、中、上游产业链产生深远影响。
汽车行业景气度可以通过量、利润和收益三个维度来反应,分别用三个代理变量来指代:量:汽车产量增速和汽车销售增速,行业利润:行业净利润增速,行业收益:行业指数超额收益。相比之下,库存和景气度的相关度则较低,因此我们不将库存列为景气度代理变量之一。这是因为库存高低与汽车的景气度没有必然的联系,比如景气好转时期,汽车处于被动去库存阶段,其库存是下降的,而在景气过热时期库存则是上升的,可以看出景气上升阶段库存与景气度的变化方向并不一致,而汽车销量与景气度变化方向则较为一致。由于汽车行业属于强周期行业,为了剔除数据的季节性或周期性影响,我们使用景气度代理变量的同比指标,因此与景气度相关的变量基本处理成同比的形式,以确保数据量纲和含义的统一。
从量的角度来看汽车的景气度,汽车产量和汽车销量同比增速直接反映了汽车行业的整体需求。当宏观经济整体向好,行业需求回暖时,人们倾向购买汽车的数量增加,汽车企业接到的订单量也会随之增多,进而制定生产计划带动汽车产量增长,生产端生产的汽车出售后使得汽车销量同步增长。
从利润的角度看汽车的景气度,汽车行业产销两旺带动财务状况改善,扣除经营成本税收支出等之外,剩余的部分就是汽车的净利润。因此净利润能综合反映汽车行业的景气度,而汽车净利润同比增速增加也可视为是汽车产量和销量增长后在财务中的直接结果。
从收益的角度来看汽车的景气度,汽车的景气度上升使得汽车相关企业盈利预期改善,盈利预期的改善给汽车股价上行带来支撑,剔除市场走势影响之后(用沪深300指数收益代替),剩余的超额收益部分可代表汽车行业的景气程度。
为了避免数据过短造成的偶然性误差给检验和预测景气度引入不确定性,我们要求数据必须满足一定长度要求,数据过短的指标虽具有一定意义,但仍选择将其剔除出数据集。我们选取的数据区间从2009年1月起持续到2019年9月,部分指标虽然比较晚但基本从2011年左右就可获得。
对于数据缺失问题,为了避免使用未来数据,我们均使用前值填充法来替代数据。而对于数据发布频率不统一的问题,我们均将其处理成月度数据。季频数据处理为月频时根据数据的可获得性进行后向填充,而日频数据处理则多采用月度平均值代替,对于收盘价数据则采用月末值。另外各指标发布时间不尽一致,因此我们需要对变量进行滞后处理,以当月底可获得的数据为准。
从景气度代理变量与汽车行业数据相关性图表中可以看出,汽车产量和销量数据之间相关性较高。而景气度代理变量与宏观经济指标相关度相比之下要低一些。
1.2. 景气度先导变量
上文中提到我们用汽车的产销数据增速、汽车行业净利润增速以及行业的超额收益来指代汽车的景气度。而三个景气度指标之间可能存在领先或者滞后关系,从传导链条来看,股市反应较为敏感,一般先于公开数据做出调整,其次是产量和销量数据,再由量的信息传导到行业净利润增速。行业净利润增速作为最终验证性的数据结论反过来也可能进一步影响行业里股票标的的表现。为了验证这一猜想,我们拟通过时间序列的超前滞后检验来验证,并定量测定宏观指标或者汽车行业中观数据对景气度代理变量的最优先行阶数。具体如下式所示:
式中n取值为-12~12,分别代表变量x滞后和超前变量y的阶数。当n的值为正时,说明x超前于y,而n值为负时,说明x滞后于y。显而易见,当n值为负时并没有意义,因为滞后于代理变量的指标对于前瞻性观测并没有帮助,所以我们更关心哪些指标是景气度代理变量的先导性指标。
下表中先行阶数越高说明指标领先代理变量的阶数越多。pvalue越低说明二者之间的相关关系越显著,而我们筛选时优先选择相关系数绝对值较高的指标,可以看出当相关系数绝对值高于0.3以上水平时,pvalue值基本小于0.01,也就是说在1%的置信度下回归系数显著不等于0,也即二者相关关系显著。因此我们在筛选指标时要求相关系数绝对值尽量大于0.3,有时候也可以适当降低标准。
汽车产量和销量同比增速与汽车行业净利润同比增速之间的超前滞后关系如下图所示,汽车产量和销量同比增速均超前汽车净利润3-6阶左右,相关系数高达0.8左右。汽车产量和销量同比增速公布时间接近且无明显的领先滞后关系。考虑到汽车行业净利润同比是季频数据,另外数据公布时间滞后于产销量数据,因此净利润数据存在一定滞后性。从相关性和走势对比来看,汽车产销量数据与净利润增速一致性较高,它们之间的关系可视为是从“量”传导到“利”的一个过程,汽车产销量数据可以作为行业净利润增速的前瞻变量。
接下来我们检验作为收益维度的景气度指标汽车行业指数超额收益(相对于沪深300指数收益)与量和利润代理变量之间的领先滞后关系,由于汽车产量、销量和净利润增速在2011年3月份之前波动较大,属异常波动,为了更契合一般的情形,我们剔除波动较大时间段,检验的时间段为2011.03至2019.09。通过检验发现与我们的前述的猜想吻合,汽车行业超额收益领先于其与汽车产量、销量以及行业净利润增速大概为9-11阶左右,在5%的置信度下回归系数显著不等于0,回归系数的检验结果显示相关关系显著,但相关系数相对偏低,只有0.25左右。股市的反应提前于产销数据以及净利润数据反应可能是因为部分投资者能提前获取相关信息或者提前做出预判,这给依赖于景气度的投资决策带来困难。
景气度代理变量中量的维度指标有汽车产量和销量同比,二者没有明显的领先滞后关系,基本是同阶的,从上文的测算中可知汽车产销数据增速领先汽车净利润同比增速3-6阶左右,因此我们进一步测算汽车产量和销量同比增速的前瞻指标,也可以认为是景气度的驱动力指标,以更好的预测二者的变化。
2. 汽车行业景气度构建与预测
2.1. 景气度预测方法
景气度的变动方向与绝对数值均具有重要意义,当景气度较前值上升时,说明景气度提升,当景气度较前值下降时,说明景气度下降。而景气度的绝对数值越高,说明行业越景气,因此在构建景气度综合前瞻指标之时,我们需要同时预测景气度的变化方向与绝对数值大小。当绝对数值较高,且变动方向为正时,说明行业景气程度较高。
我们拟用上文得到的先导指标来预测景气度的变动方向,景气度代理变量我们选择汽车销量同比增速,其先导指标包括m2、pmi、fixed_assets、termdiff、finance、usdx、m2m1等指标,我们将先导指标按照领先阶数进行偏移,以相关系数作为权重分配的依据,如果先导指标上行则赋值为1,下行则赋值为-1,加权后将结果累计即为景气度指标的变动方向预测(负相关指标处理方式相反),预测结果在0-1区间则为景气度上行,-1-0区间内为景气度下行,预测结果显示准确率为47.6%,低于50%,因此我们认为使用该方法预测景气度的方向变动胜率较低,效果一般。主要原因在于从先导因子的变动方向到景气度因子变动方向的预测过程中损失了因子的许多信息,效果不佳,下文中我们将使用动态预测模型和Combine Forecast(David E. Rapach,2008)进行预测,同时比较预测大小与变动方向的准确率。
动态预测模型采用滚动窗口样本外推预测的方式,动态预测能更有效的利用当前时点因子信息,而且对因子的选择上也更为灵活。只有历史窗口中预测效果显著的单因子才被纳入预测因子池中,为了防止因子间相关性过高,我们设置方差膨胀系数(VIF)阈值为10,通过VIF法剔除增量信息不明显的因子,从而降低因子间相关性,一般认为VIF低于10则因子间共线性不明显。接下来再用剩下的因子进行多元回归预测,预测下一期的被预测值。当期如果所有因子均不显著,则当期预测值缺失。
由于我们采用的先导指标与景气度代理变量间相关性较高,动态预测是我们虽剔除了相关性较高的因子,但是可共线性问题仍可能存在,使得预测结果的可靠性降低,因此我们考虑采用Combine Forecast的方法进行预测并构建景气度指标。联合预测估计时首先采用一元回归,再将各个单元回归预测的目标值进行加权,得到目标预测变量更加稳健的预测结果。由于变量间相关性较难估计,而且难以估计准确,因此剔除解释变量间的相关性影响的这种预测方式可能成为联合预测的优点。
预测结果大小的准确率我们用MSE(Mean Squared Error)数值来表征,而预测方向准确性我们用被预测量的环比变化正负值来表征,预测结果和实际值相对于上一个值的变化方向相同时认为预测方向结果正确。
2.2. 景气度预测结果
下面统计了景气度代理变量的预测结果,结果准确率我们用方向正确率和大小准确率(MSE)两个维度来表征。
先导变量经过偏移和未经偏移的预测效果对比,先导变量经过偏移之后与被预测变量的相关性提高,但是由于领先被预测变量几个月时间,因此变量时效性比较差。未经偏移的先导变量时效性比较好,变量涵盖了最新的信息,但与景气度代理变量之间的相关性稍差。为了对比这两种情况下预测情况的差异,我们在下表中进行对比。
下表中对比多元动态预测的情况,对比发现经偏移之后有效预测次数明显减少,原因在于经偏移的先导变量与被预测量之间的相关性需满足一定的阈值,因此筛选过后的变量数明显少于未经偏移下的变量数。而方向准确率整体看先导变量经偏移下预测准确率更高一些,大小误差方面也明显小于未经偏移的情形,经偏移的情况下预测精确度在0.05的置信水平下明显优于滚动24个月预测结果的精度。
3. 基于景气度预测值构建交易策略
3.1. 基于行业超额收益预测值构建交易策略
根据汽车行业的超额收益预测结果可以构建相关策略,当预测超额收益为正时做多汽车行业,当预测超额收益为负时做空汽车行业,我们采用多空操作构建策略。由于A股有做空限制,做空时本应该空仓,但空仓情况下交易次数比较少,且从结果看胜率往往比较高,因此忽略做空限制构建多空策略。下图为滚动窗口为36个月时的汽车超额收益预测结果,策略在股市异常波动期间出现较大回撤外,其余时间段表现较为平稳,能稳定获得超越基准的收益。下图所示不考虑开平仓手续费的情况下多空策略年化超额收益5.75%,预测月度准确率达到56.25%。策略整体表现可观,不过在2014年底A股开启牛市,沪深300指数大幅上涨,汽车指数受限于单一行业属性跑输沪深300。
3.2. 基于销量和库存增速预测值构建景气时钟策略
前文我们构建了景气度预测模型,本节中我们依据汽车销量和库存的预测结果划分汽车景气时钟,并根据划分的结果进行行业配置,在景气好转和过热的阶段配置汽车行业,而在衰退和萧条的阶段不配置汽车行业,为了防止短期数据波动对策略干扰,我们加入了一定的过滤条件,也就是三期中如果有两期处于景气好转且过热,并且当前阶段为景气或者过热则开仓或者保持持仓,反之则平仓。根据策略的表现来判断策略的有效性。但预测结果显示库存同比变化的预测准确度不够高,但整体的变化趋势基本一致,我们认为数据的短期波动影响较为有限,因此使用滞后一期的库存变化方向替代实际的库存变化方向。
基于景气时钟的轮动策略虽然有两个变量,但是决定我们是否配置汽车行业的关键变量是汽车的销量增速变化,如果销量增速是上行的,则处于景气好转或者过热周期,而销量增速下行,则处于景气衰退或者萧条周期。使用预测值进行景气周期划分时未使用未来数据,作为对比,我们用实际值来划分景气周期,并假设实际值在月初就已经获悉。
对比结果如下所示,根据实际值和预测值划分景气周期的轮动策略净值基本都能稳步上升,但是基于预测值构建的策略在2017年后策略净值基本走平,2017年之后汽车行业景气度整体下行,行业表现乏善可陈,这种行业结构性的走弱一定程度影响策略的表现,不过值得一提的是策略基本规避了行业的趋势下行期,因而使得最终的净值回撤相对可控。
基于预测值构建的策略不考虑手续费年化收益达到9.43%,夏普率为0.46,最大回撤-18.39%。而基于实际值构建的策略(无滞后)年化收益为15.06%,夏普率为0.53,最大回撤-17.19%,基于实际值构建的策略(滞后一期)年化收益为-3.68%,夏普率为-0.22,最大回撤-32.68%,预测值构建的策略稍逊于无滞后的实际值策略,但明显好于滞后一期的实际值构建的轮动策略,说明预测有一定的效果,不过预测准确度需进一步提升。2018年后预测策略回撤扩大,主要原因是一方面2018年权益市场整体下行,另一方面汽车行业的景气度也下行,不过中间有反复的过程,因此导致策略回撤扩大。
今年以来汽车销量增速下滑趋势触底,近几个月已然抬升,外加宏观经济数据有边际转好的迹象,我们认为汽车行业整体景气度上行,在景气度抬升过程中汽车行业的配置价值将得以凸显。
声明:文章仅代表原作者观点,不代表本站立场;如有侵权、违规,可直接反馈本站,我们将会作修改或删除处理。