跳转至


课程  因子投资  机器学习  Python  Poetry  ppw  tools  programming  Numpy  Pandas  pandas  算法  hdbscan  聚类  选股  Algo  minimum  numpy  回测  数据标准化  algo  FFT  模式识别  配对交易  GBDT  LightGBM  XGBoost  statistics  CDF  KS-Test  monte-carlo  VaR  过拟合  algorithms  machine learning  strategy  python  sklearn  pdf  概率  数学  面试题  量化交易  策略分类  风险管理  Info  interview  career  复权  数据  tushare  akshare  xgboost  PCA  wavelet  时序事件归因  SHAP  Figures  Behavioral Economics  graduate  arma  garch  人物  职场  Quantopian  figure  Banz  金融行业  买方  卖方  story  量化传奇  rsi  zigzag  穹顶压力  因子  ESG  因子策略  投资  策略  pe  ORB  Xgboost  Alligator  Indicator  factor  alpha101  alpha  技术指标  wave  quant  algorithm  pearson  spearman  套利  LOF  白银  因子分析  Alphalens  涨停板  herd-behaviour  momentum  因子评估  review  SMC  聪明钱  trade  history  indicators  zscore  波动率  lightgbm  强化学习  顶背离  另类数据  freshman  resources  others  AI  DeepSeek  network  量子计算  金融交易  IBM  weekly  进化论  logic-factor  machine-learning  neutralization  basics  LLT  backtest  backtrader  研报  papers  UBL  quantlib  jupyter-notebook  scikit-learn  pypinyin  qmt  xtquant  blog  static-site  duckdb  工具  colors  free resources  barra  world quant  Alpha  openbb  risk-management  llm  prompt  CANSLIM  Augment  arsenal  copilot  vscode  code  量化数据存储  hdf5  h5py  cursor  augment  trae  Jupyter  jupysql  pyarrow  parquet  数据源  quantstats  实盘  clickhouse  polars  滑动窗口  notebook  sqlite  sqlite-utils  fastlite  大数据  PyArrow  UV  Pydantic  Engineering  redis  remote-agent  AI-tools  Moonshot  回测,研报,tushare  dividend 

洛书投资:先验性因子与波动率等权


题图: 墨尔本大学 自然哲学楼
by Drechmeria@wikimedia

从今天起,我们将正式推出一个全新系列 ——解读私募创始人公开采访实录。这个系列的核心目标,是带大家从创始人的分享中,提炼出实用的量化投资知识与关键的行业洞察。首期内容,我们将走进洛书投资,一起来解读创始人谢冬的分享。

缘起:一份来自校友的关注

至于首期为何选择洛书投资,此前我们梳理过一众私募创始人的学术背景,在满屏清北复交、MIT、斯坦福等名校履历里,我意外发现了洛书投资的李南峰先生是我(注,本文作者 Flora)的校友。这份校友渊源带来的亲切感与自豪感,让我萌生了深入探究这家机构的强烈兴趣。

我们今天想要解读的是来自中国证券报在25年3月关于谢冬的,题为题为《量化长跑者 十年拓荒路》的采访。在这篇篇幅不长的采访里,我最感兴趣的内容是谢冬先生关于洛书投研体系的介绍,接下来我们将一同透过谢冬先生的分享,看看究竟能从中挖到哪些 “好东西”呢。

关于公司现行投研体系,谢冬先生以量化 CTA 策略举例说明,提到流程上大致包含两个核心环节。

“首先是做因子挖掘,也就是组成各类策略的基础单元,寻找可量化的因子,建立因子库进行组合。例如,在趋势、期限结构以及基本面这三类因子被选择出来之后,再用量化的方式进行检验和呈现。在此之中,谢冬表示,有别于大多数同业机构认为量化方法依赖于统计套利,即“相信历史会重演”,洛书的先验性因子更相信“因子背后的经济学规律在未来会延续有效”,而不是简单的“现象重演”。

其次,在策略组合上,公司采用了波动率等权管理的配置方式,不会根据市场行情人为主观进行择时,调整策略的比重,而是完全依赖于精细化风险管理模型进行科学、客观的管理,真正践行量化投资方法和理念。”

洛书的核心分野:先验逻辑 vs 统计套利

我在这段话中提取到了两个关键点。

第一个信息是:洛书投资采用的先验性因子,不同于同业依赖 “历史会重演” 的统计套利,它更信奉因子背后的经济学规律。

这短短的一句话恰恰点明了洛书量化逻辑与多数同行的本质区别。怎么理解呢?

我们先来一下谢冬先生提到的大多数同行的量化逻辑。请注意历史重演统计套利这两个词。依赖 “历史会重演” 的统计套利,也就是说很多量化是通过挖掘历史数据中 “看似相关、但无明确逻辑支撑” 的统计关联来构建策略。他们把量化当成是基于纯数据的统计归纳。

接着,请注意先验性因子经济学规律这两个词。洛书的 “先验性因子”,关键在先验二字 ,也就是说它的因子构建是先锚定明确的经济学规律,再用数据去验证规律的可持续性。也就是说它并不是简单地从数据中拼凑出这种关联,而是一种基于经济学逻辑的演绎推理。

在量化入门认知的那期播客中我曾经提过,在《打开量化投资的黑箱》一书中,作者里什·纳兰将阿尔法模型划分为理论驱动型阿尔法模型数据驱动型阿尔法模型

理论驱动型阿尔法模型又可以细分为六类。我们以其中两个策略为例,让大家对理论驱动型策略的”理论驱动“的定义有个基本认知。比如,均值回复策略的基本理论认为,价格围绕其价值中枢而上下波动,判断出这个中枢以及波动的方向便足以捕捉到交易机会。再比如,趋势跟随策略是基于”在一定时间内,市场通常是朝着同一个方向变化“的假设,据此对市场趋势做出判断就可以作为制定交易策略的依据。趋势法存在的经济学基本原理是市场均衡理论。

而数据驱动型阿尔法模型所使用的输入变量主要是交易相关的,比如价格数据。它试图从中找出一些对未来具有解释能力的模式。这类基于经验的模型,它的优势是它可以分辨出一些市场行为,无论该行为目前是否可以用理论加以解释,从而即使不理解某些市场行为的成因依然可以发现他们。而理论驱动型只能捕捉到人们对其有所认识的一些行为,所以它的范围也被局限在均值回复、趋势跟随这六类。数据驱动型阿尔法模型的缺点也很明显。比如研究人员用以建模的数据和想要预测的东西如果根本没有联系或相关性很低,那么就会导致回测买地球,实盘亏成狗的结果。

有了这样的知识背景后,我们就能自然而然地发现,谢冬先生说的大多数同行的量化策略其实就属于数据驱动型的阿尔法模型,而洛书的策略则属于理论驱动型阿尔法模型

思想实验:贝叶斯侦探的破案逻辑

另外,当大家在听到“先验”一词时,你们的脑海中会联想到什么呢?当我看到“先验”时,我下意识想到了统计学中的贝叶斯派系。贝叶斯的核心哲学是,我们对世界的认知不是一张白纸,而是带着“成见”的,新的证据只是用来修正这个“成见”。与之相对的另一个统计学重要分支是频率概率派

为了让大家搞懂贝叶斯与频率概率之间的区别,我们来举一个侦探破案的例子。

想象你是一位经验丰富的贝叶斯派系刑警,现在正在调查一起密室盗窃案。你将通过以下三步去推理案件:

第一步是建立“先验”(Prior):在还没去现场看证据之前,你根据经验和卷宗,发现嫌疑人A欠了巨额赌债,且有盗窃前科;而嫌疑人B是著名的慈善家,家财万贯。这时候,你的逻辑判断(先验概率)告诉你:A作案的可能性很大,B的可能性极小。这就是带着“成见”出发,也是洛书强调的“经济学逻辑”。

第二步是看“似然度”(Likelihood):也就是看证据。你到了现场,发现保险柜上有一枚指纹,经过比对,这枚指纹竟然属于B。这个新证据(数据)非常强硬,它极大地支持了“B是凶手”的假设。

第三步是得出“后验”(Posterior):你需要结合“A有动机”的先验和“B有指纹”的证据来更新你的判断。

这时候,领导安排了另一位频率概率派的侦探和你共同办案,此时这两派的分歧就出现了。

频率概率派认为,数据只能告诉我们概率以及围绕着概率的置信区间。因此,关于案件的解读,他们会说:“数据显示指纹匹配度99.9%(P值显著),事实说明这就是嫌疑人B留下的指纹,根据数据推断B就是罪犯。” 他们只描述数据呈现的事实,不在乎B是不是慈善家,也不去预设“B没动机”这样的立场。

而贝叶斯派会更谨慎。他们认为:虽然指纹是B的(数据支持),但B完全没动机啊(先验逻辑极强),有没有可能是有人伪造了他的指纹进行栽赃陷害呢?

因此,贝叶斯派虽然会因为指纹证据而提升对B的怀疑(修正先验),但因为有强大的先验逻辑(经济学规律)做底色,他们不会盲目相信单一的数据证据。

同样地,如果一个策略回测数据好上天,但完全解释不通为什么,洛书可能会认为这是“伪造的指纹”,也就是过拟合,从而放弃它。

到这,相信聪明的大家已经隐隐约约感觉到了理论驱动型阿尔法模型的经济学理论与贝叶斯先验之间以及数据驱动型阿尔法模型与频率统计之间的哲学关联了。

仓位管理的艺术:波动率等权

接着,我们再来看看第二关注点。谢冬先生提到:在策略组合上,洛书采用了波动率等权管理的配置方式,不会根据市场行情人为主观进行择时,调整策略的比重。这里请注意波动率以及等权这两个词。

《打开量化投资的黑箱》一书将风险度量划分为纵向与横向两个维度,两种方式的核心逻辑与应用场景各有侧重。

第一种是纵向风险度量,它聚焦于单一产品在时间维度上的收益不确定性。具体计算方式是,统计某一产品在不同时期的收益数据,请注意“不同时期”这个关键词,然后通过计算该产品收益的标准差来衡量风险水平。标准差这个指标在金融领域被统称为波动率。波动率数值越高,代表该产品的收益波动越剧烈,对应的单一标的风险也就越大。

第二种是横向风险度量,它着眼于同一时间点、给定范围内各类金融产品的表现差异度。请注意“同一时间点”和“给定范围”这两个关键词。横向风险度量的计算方式是,统计同一时刻下所有相关金融产品的收益情况,并计算其横截面标准差。横截面标准差的数值越大,意味着这批金融产品的表现分化越明显、多样化程度越高。这往往代表市场整体风险处于较低水平,因为投资者在构建投资组合时,能够挑选足够多表现差异化的标的进行搭配,从而实现分散风险的目的。

波动率等权这个词本质上是仓位配置的问题。投资组合的权重分配,核心是在期望收益、风险水平与交易成本三者间找到动态平衡,三者任何一方的过度倾斜,都会导致组合运行失衡。若一味侧重捕捉交易机会,盲目追逐潜在收益而忽视风险管控,往往会因标的波动超出承受范围,给组合带来不必要的损失;若过度聚焦风险规避,一味收缩仓位、限制交易,又会错失优质投资机会,导致组合收益长期低于预期;而若对交易成本过度敏感,甚至因忌惮成本而拒绝调整组合,又会让系统陷入持仓长期固化,既无法适配市场变化,也难以兑现收益潜力。

至于怎么分好蛋糕,里什·纳兰将其分为了基于规则的模型基于优化的模型这两大类。常见的基于规则的投资组合构建模型有4类,分别是:相等头寸加权相等风险加权阿尔法驱动型加权决策树加权。针对这四种加权方式我们做一个简单的解释:

第一种,相等头寸加权,又可称为等权配置模型,是最基础的规则型加权方式。它是指投资组合中所有标的的持仓头寸占比完全相同,也就是说,不管标的的风险是高是低,收益是好是坏,都统一将资金平均分配给投资组合中的所有标的,使得它们的占比相等,比如我有100万,买10只股票,那么每只都买入10万。

第二种,相等风险加权,它的核心是让组合内各标的 对整体组合 的风险贡献度相等,以此降低单一标的风险过度集中的问题。该模型需先测算各标的的风险指标,比如波动率、VaR值等,再通过调整头寸占比,使每个标的的边际风险贡献趋于一致。简单来说就是:谁风险大,我就少买点;谁风险小,我就多买点,最终使得每个标的的风险是相等的。所以洛书使用的波动率等权就是属于相等风险加权这一种。

第三种,阿尔法驱动型加权,它以标的的阿尔法值,即超额收益,为核心加权依据。阿尔法值越高的标的,获得的持仓权重越大。其规则逻辑是优先配置能为组合创造超越基准收益的资产,需通过量化模型对标的未来阿尔法值进行预测与排序。换句话说就是:谁的信号强,我就重仓谁。 比如模型预测A股票涨停概率90%,B股票只有51%,那我就把80%的仓位押注在A上

第四种,决策树加权:基于决策树算法的规则逻辑构建权重分配体系,通过设定多层量化规则,比如标的的市盈率区间、流动性阈值、行业分类等对资产进行分层筛选与权重赋值。例如先按行业划分权重比例,再在行业内根据个股的财务指标确定具体头寸占比。

以上是第一类基于规则模型的介绍,接下来我们再简单了解一下基于优化的模型。

这类模型会借助特定算法,寻找能实现宽客预设目标的最优解决方案。这里所说的算法,本质是一套预先设定的、环环相扣的规则,能够指引使用者从初始状态一步步抵达目标状态。模型中这个需要达成的预设目标,通常被称为目标函数。在量化投资领域,目标函数的典型应用场景,就是构建这样一类投资组合 —— 让每单位风险所对应的潜在收益达到最大化,也就是我们常说的 “风险调整后收益最大化”。这类优化模型的特性决定了,想要吃透它的底层算法细节并非易事,但它的核心逻辑其实十分清晰易懂。

总结

谢冬先生说“洛书投资的九宫格不仅是数学符号,更是对金融市场及市场规律的敬畏和不懈追求”。通过对采访内容的拆解,我们得以深入理解洛书的投研与管理之道,更重要的是,它为我们揭示了顶尖私募管理者构建稳健投资逻辑的核心思路。