承接上篇哈!
现在我们已经知道所谓的多因子模型,其实说白了就是给股票做全面多维度体检。
同时,我也讲了,线性代数是它的数学框架。
那么具体说来,它到底是怎么用数学工具量化的?又是怎么服务实际投资的?
上篇提到,多因子模型的本质,其实就是多因素加权,但背后的降维思想和线性组合思想,才是它能从理论落地到实操的关键。
也就是说,其实早在这东西搞出来之前,华尔街有经验的交易师,已经隐约感觉到这方面的东西了。但是他们只能靠感觉,既说不明白,也算不出来。
而这俩人运用线性代数,把那些模糊的经验认知,转化成了精确的知识和数字。
那具体来说,他们是怎么做到的呢?
比如说,市场上有4000多只A股,影响股价的变量何止成千上万:业绩增速、市盈率、市净率、公司规模、行业景气度、资金流向、政策利好、市场情绪……单看每一个变量,都是一个独立的“维度”,海量维度堆在一起,就像一团理不清的乱麻,普通人根本没法分析。
这时候,线性代数的降维思想就派上用场了——它的核心是:从海量高维变量中,提炼出少数几个有效且独立的核心维度,用这几个维度概括绝大多数信息,把复杂的高维数据简化成清晰的低维主线。
举个线性代数的通俗例子:
假设我们把每只股票的100个影响因素,看作一个100维的向量,在线性代数里,向量就是一组有序的变量集合。这100个维度里,很多是重复或无效的——比如公司员工数量和公司规模高度相关,短期资金炒作和市场情绪高度重合。
线性代数会通过主成分分析(PCA)这种经典方法,计算出哪些维度对股价波动的贡献度最高:比如发现市场因子、规模因子、价值因子这3个维度,能解释80%以上的股价波动,剩下97个维度加起来,只解释不到20%。
于是,我们就把100维的复杂数据,压缩成3维的核心数据——这就是降维。就像看一座高楼,不用盯着每一块砖的位置,只看高度、宽度、结构三个核心维度,就能清楚它的整体形态。对投资者来说,不用盯海量零散信息,只抓核心因子,分析效率直接翻了N倍。
同时它会用到线性组合思想,把收益看做是,因子加权求和,矩阵运算的核心逻辑。
这是多因子模型最核心的数学表达,也是它能量化分析的根源。
多因子模型的核心公式,用线性代数的语言表达是:
股票收益 = 市场因子×系数₁ + 规模因子×系数₂ + 价值因子×系数₃ + … + 误差项
翻译成线性代数的矩阵形式,更直观:
R = Xβ + ε
R:股票的收益向量(代表多只股票的收益,是一个列向量);
X:因子矩阵(每一行代表一只股票,每一列代表一个因子,比如规模、价值、盈利等,是一个二维矩阵);
β:因子系数向量(代表每个因子对收益的影响权重,是一个列向量,也就是咱们说的“因子暴露度”);
ε:误差项(代表模型解释不了的部分,比如突发黑天鹅、纯运气影响)。
每个因子都是权重,共同决定收益。
假设某只股票的收益,只受市场、规模、价值三个因子影响(简化版三因子模型),对应的系数分别是β_1=0.8、β_2=0.5、β_3=-0.2。这里的负数代表该因子对收益是反向影响。
如果当期市场因子涨了1%,规模因子涨了2%,价值因子跌了1%,那这只股票的收益就是:
收益 = 0.8×1\% + 0.5×2\% + (-0.2)×(-1\%) = 0.8\% + 1\% + 0.2\% = 2\%
这里的关键是“线性组合”——股票收益不是单一因子决定的,而是各个因子按系数权重叠加的结果。这和咱们算总分是一个道理:考试总分=语文×权重₁+数学×权重₂+英语×权重₃,每个科目的权重不同,对总分的影响就不一样。
对应到线性代数里,矩阵运算就是帮我们快速完成这种多权重叠加计算的工具。面对几百只股票、十几个因子,人工计算根本来不及,但用矩阵运算,电脑能在几秒钟内算出所有股票的收益归因,这就是线性代数的实用价值。
前面提到的因子暴露度,其实就是公式里的系数β。它代表股票对某个因子的敏感程度:
低估值股票,在价值因子上的暴露度(β)更高,意味着价值因子涨1%,它的收益涨得更多;
小市值股票,在规模因子上的暴露度更高,小盘风格来临时,它的超额收益就更明显。
暴露度不是固定的,会随市场周期、行业变化而调整。比如某只小盘股突然被纳入蓝筹指数,它的规模因子暴露度就会降低,收益受规模因子的影响也会变小。
如果你理解了以上核心思想,咱们就来梳理多因子体系里的核心成员。
经过市场和学术双重验证,这些因子被分为五大经典基础因子,也就是核心骨架,和常用风格因子,也就是补充维度,还有外部影响因子。
每一个因子,背后都对应着线性代数里的变量筛选逻辑,它们都是通过历史数据回测,证明能有效解释收益差异的核心变量。
五大经典基础因子,是多因子模型的核心骨架。这五个因子是所有多因子模型的基础,就像人体的骨骼,支撑起整个分析框架。那么它们是什么含义,怎么验证,怎么量化的呢?
(1)市场因子(Market Factor)
这个因子,代表大盘整体波动对股票收益的影响,是所有因子的基础。
前面我讲过,它是CAPM模型里的唯一因子,在多因子模型里依然保留,因为大盘是影响股价的最大变量。通过矩阵运算,我们能算出每只股票对市场因子的暴露度(β),也就是我们常说的“贝塔值”。
它对我们的意义:赚的是“市场上涨的钱”,是所有投资者都绕不开的收益来源。比如大盘涨5%,哪怕你的股票没踩中任何风格因子,也大概率能跟着涨3%-4%,这就是市场因子的贡献。
(2)规模因子(SMB,Small Minus Big)
意思是说,对比小市值公司和大市值公司的收益差异,核心逻辑是“小市值股票需要更高的风险补偿,长期能获得超额收益”。
法玛-弗伦奇当年就是用线性回归,对不同市值分组的股票收益做了计算——发现小市值组的收益减去大市值组的收益,长期为正,且这个差值在统计上显著(不是偶然),于是验证了规模因子的有效性。
对我们来说有什么意义?它帮我们赚的是小公司成长溢价。但要注意,A股里小盘股的超额收益有明显的周期性,不是永远有效,这也是线性代数回测能发现的规律。
(3)价值因子(HML,High Minus Low)
意思是说:对比低估值,即高账面市值比,和高估值,也就是低账面市值比,股票的收益差异,它的核心逻辑是,便宜股长期会跑赢贵股,估值修复是核心收益来源。
通过计算“低估值股票收益 - 高估值股票收益”的差值,用线性回归验证这个差值的长期显著性。比如用市盈率(PE)、市净率(PB)作为估值指标,分组后计算收益差,就能得出价值因子的有效性。
它帮我们赚的是,估值修复的钱。这个因子非常适合熊市布局,因为低估值股票抗跌性更强;但牛市里,高估值成长股往往涨得更快,价值因子会暂时失效,这也是因子周期的体现。
(4)盈利因子(RMW,Robust Minus Weak)
定义:对比高盈利公司和低盈利公司的收益差异,核心逻辑是“能持续赚大钱、盈利稳定的公司,经营更稳健,长期收益更高”。
这东西常用ROE(净资产收益率)、ROA(总资产收益率)、毛利率等指标作为盈利衡量标准,通过线性回归,计算高盈利组和低盈利组的收益差,证明高盈利组的收益显著更高。
利用这个因子,我们赚的是优质盈利的钱。比如茅台、宁德时代这类高盈利、现金流好的公司,长期收益远低于盈利差的公司,这也是咱们选股票时的核心参考维度。
(5)投资因子(CMA,Conservative Minus Aggressive)
它是对比稳健投资(低资本支出)和盲目扩张(高资本支出)公司的收益差异,核心逻辑是“盲目扩产的公司容易出现产能过剩、现金流断裂,长期收益反而更低”。
用“固定资产投资增速、研发投入增速”等指标衡量公司投资行为,分组后计算收益差,用线性回归验证稳健投资组的收益优势。
我们可以利用这个赚稳健经营的钱。很多公司为了短期业绩,疯狂砸钱扩产、跨界并购,看似热闹,实则埋下隐患,而那些稳扎稳打、不盲目扩张的公司,反而能走得更远。
其实在这五大基础因子之外,还有一批常用的风格因子,它们能进一步提升模型的解释力,就像做菜时的调料,让味道更丰富。这些因子同样是通过线性代数的回测验证,被证明具有长期收益优势。
(1)动量因子(Momentum)
它是指,过去6-12个月涨得好的股票,短期(1-3个月)大概率继续涨。用“过去N个月的累计收益”作为变量,线性回归验证其对当期收益的正向影响。
但是要注意:A股市场短期动量效应不明显,常出现“反转”,中期(6-12个月)动量效应更显著。
(2)反转因子(Reversal)
是指短期(1个月内)涨太多或跌太多的股票,会反向回调,回归均值,适合在A股震荡市中,反转因子的收益优势更明显。
(3)低波动因子(Low Volatility)
像那些股价波动小的股票,长期风险调整后收益更高,因为少亏多赚的复利效应更明显。用股价波动率、标准差作为变量,线性回归验证低波动组的收益优势。
(4)红利因子(Dividend)
这类高股息、稳定分红的股票,适合长期持有,收益由“股息+股价上涨”两部分组成,抗跌性强。适合追求稳健收益的长期投资者,比如退休人群。
(5)成长因子(Growth)
有些营收、净利润增速快的公司,未来成长空间大,能获得超额收益。
但是要警惕一件事:成长因子和价值因子往往是反向的,高成长公司通常估值也高,需平衡搭配。
除了公司自身的因子,宏观环境、行业趋势也会影响股价,这些可以作为外部因子纳入模型,同样用线性代数的方法量化其影响,比如:
行业景气度因子:用行业营收增速、订单量等指标,衡量行业周期对股票收益的影响。
宏观经济因子:GDP增速、通胀率、利率等,影响整体市场资金面。
政策因子:财政政策、货币政策、行业监管政策等,是影响股价的重要变量。
总结一下,我希望你们记住的点:
1. 多因子的两大核心思想:降维思想,线性代数的维度简化,和线性组合思想,矩阵运算的收益计算,这是理解多因子的底层逻辑,也是它能精准量化的关键。
2. 主流因子体系:五大经典基础因子+常用风格因子+外部因子,
今天讲的比较理论化,听上去过于复杂,确实是诺奖级的东西,但是我们作为非专业小白,怎么利用这个东西来赚钱呢?看下篇。
