普校逆袭天花板 进化论王一平:有逻辑的量化
最后更新: 2026-01-16
Table of Content
进化论资产创始人王一平,是一位从少年时期便展现投资天赋的私募从业者。
14 岁起借助父亲证券账户入市,早期因“误打误撞” 践行价值投资而获利。很特别的是,他并非名校背景出身。他本科就读于江西财经大学国际金融专业,大三时斩获全国大学生金融投资模拟交易大赛 股票组冠军,后保送本校金融工程硕士。
硕士在读期间,他获得父母10万元启动资金,通过港股与A股的指数套利,研究生毕业时将本金翻了50倍。
2014年,他创办进化论资产,正式进军私募。2016年之前他主要是做主观投资,2016年开始尝试主观+量化的模式,到2021年底决心转型做“有逻辑的量化”。
所以我们本期要解读的,就是来自券商中国在25年4月,针对王一平先生展开的题为《坚持手写因子,做有逻辑的量化投资》的深度访谈。得益于这篇极具深度的采访,我们才能在今天一同解读王一平先生是如何顺利地从主观转向量化,以及他口中的“有逻辑的量化”到底是什么。
逻辑类因子指什么?它是否来源于主观?¶
关于这个问题王一平先生是这样回答的。
逻辑类因子植根于投资第一性原理与市场底层运行规律,本质是人类对市场的深度认知沉淀,核心价值在于弥补传统量化模型应对小样本极端事件的短板。股市的核心逻辑是 “价格围绕价值波动,偏离过度终将均值回归”,但侧重中短期收益的统计类量化模型,往往缺乏这种底层认知 —— 比如 2024 年初小微盘股估值虚高后流动性枯竭,有经验的投资人会避之不及,可量化模型却会因短期超跌信号盲目抄底,最终蒙受重创。
这类极端场景虽历史罕见、不具备统计显著性,却足以让策略遭遇致命打击。投资从不是单纯的数字游戏,股市是实体经济的镜像,既充斥突发变量,也遵循固有规律。忽视这些本质,策略便会变得脆弱不堪,甚至面临崩溃风险。因此,我们必须将 “价格围绕价值运动” 这类底层原理嵌入模型,为量化决策筑牢安全底线。
如果大家看了我们上一期的内容,此刻应该会有一种豁然开朗的感觉。
这里提到的逻辑类因子其实就是上一期洛书投资的先验性因子,它们都是指理论驱动型alpha模型。
在这场访谈中,王一平先生还为我们扩展了逻辑类因子在实战中的优势以及数据驱动型alpha模型的不足。
王一平表示,进化论能在24年2月以及后续4月和6月的两次小微盘股的大跌有效控制回撤的主要原因,是他们的逻辑类因子中的长尾因子发挥了作用。这些因子及时阻止了模型去抄底小票。
统计类因子认为过去小票涨得很好,现在大跌了应该去抄底;逻辑类因子则认为小票已经没有流动性,应该回避。双方阵营持不同意见,但逻辑类因子拥有“一票否决权”。
至于为何会决心做有逻辑的量化,王一平说,刚开始他们的量化策略表现很好,但在2019年,模型便开始逐渐失效。问题出在过度依赖机器学习。因为当时他们绝大多数因子是机器自动衍生出来的,这是一个模仿学习的路径,过程是一个黑箱。
而且,因子数量太多以至于根本看不过来,当业绩出现问题的时候,便没有办法做到及时有效的归因。所以,王一平指出,难以归因,并实现真正的创新是机器学习存在的问题。所以他们拿掉了所有机器学习生成的因子,回归到最开始手写的那些基于逻辑的因子上。
不过,王一平先生也表示,模型的稳定性源于多元性,统计类因子与逻辑类因子同等关键。人类的自上而下演绎推理,与机器的自下而上样本归纳,是两种互补的视角,归纳法与演绎法相结合才是更科学的方法论。
主观转量化的学历路径¶
开头我们提到,王一平先生最开始是做主观投资的。当记者问及他从主观转到量化的初期都做了哪些事情时,王一平先生的学习路径可供所有想要从主观转向量化的朋友参考。
他花了一年时间读了国内外200多篇论文,对量化的整体架构和实践建立起比较笼统的理解,当时基本是每天学习十三四个小时,没有一天休息。
但他认为理论跟实践有很大距离,我们并不能直接照搬国外的经验。所以在构建因子时,他在参考海外论文方法的同时,会再结合A股市场特点,对部分常见因子进行本土化改造;也会在研究过程中,触类旁通地想到了一些较有特色的因子,进行原创。
王一平先生还提到了著名的论文“Alpha101”,这篇文章讲的是端到端地输入数据,让机器输出一些统计意义上有效的因子。参照这种方法,他们以自己开发出的基础因子作为底座,让机器衍生出数千个因子去跑模型。
alpha101¶
这里补充介绍一下alpha101和“端到端”。
Alpha101是世坤于2015年公开的101个可直接用于量化策略的量价类因子,这些因子本质是基于历史数据挖掘的统计规律,它的收益来源是市场参与者的行为惯性、信息不对称、流动性摩擦等,是许多量化人初期学习时不可多得的练手材料。
在匡醍量化的《因子分析与机器学习策略》课程中,我们也重点讲解了Alpha101因子的构建原理。
那这时候就有朋友要问了,既然101个因子都已公开且被大众熟知了,那它的收益不会衰竭吗?这些因子不就失效了吗?
有道理但不完全准确。一方面,正如王一平先生所说,他在学习alpha101时会对这些因子进行本土化处理,并不会直接照搬,经过改版之后的因子,我想它在A股的土壤中或许依然能创造出超额收益。
另一方面,你说用的人多了,会导致因子失效。同样地,当大家都觉得它失效了而不去使用它的时候,这个因子是否又会变得有效呢?这也是策略周期性的来源。此外,我们说废品还可以进行回收再利用呢,旧信号我们依然可以挖出新价值。
每个因子都有适合它的场景,它的有效性依赖特定市场环境、品种属性或时间窗口。
我们可以通过场景化归因,识别出因子产生超额收益的特定市场环境,从而实现因子的精准择时与配置。
我们也可以对旧因子进行结构化拆解,将其还原为基础变量的线性或非线性组合,并重新审视这些基础变量的加权逻辑与内在假设,然后通过优化变量权重或重构组合方式,在不引入新数据源的前提下,挖掘出旧信号中被掩盖的Alpha价值,实现策略的内生进化与迭代。
端到端、非端到端的区别是什么¶
“端到端”(End-to-End)是啥呢?它是机器学习中的一个概念,与之对应的是”非端到端“。
在量化投资的策略构建与执行框架中,端到端策略与非端到端策略的核心差异,在于从原始输入数据到最终交易决策的转化路径是否经过人工拆解的显性中间环节。
非端到端策略则遵循人工主导的分步逻辑,需要先基于金融理论与历史回测人工筛选有效因子,再通过标准化、中性化等手段处理因子数据,随后人工设定因子权重并构建打分体系,最后根据股票综合得分生成投资组合,全流程的每一步骤均具备可解释性与可追溯性。
端到端策略是由模型自主学习数据间的潜在关联与规律,无需人工预设因子筛选、权重分配等规则,最终直接输出股票买卖信号或资产配置组合的一体化模式。
简单来说,端到端策略将决策权交由模型自主挖掘,非端到端策略则由人工规则主导策略逻辑的构建。所以我们才会说这个过程是一个难以追溯的“黑箱”。
每日名校¶
今天介绍的名校正是王一平的母校,江西财经大学。虽然它的名气可能不如清北复交,但它在金融圈和创投界的“校友力”却极其惊人。今天我们不猜校名,来猜猜这几位从江财走出的重量级人物:
- 资本市场的“守望者”:他是我国著名的经济学家,曾任中国人民大学副校长,以对资本市场的深刻洞见和直言不讳著称。
- 百亿私募的“逻辑控”:也就是我们今天文章的主角。他在读研期间就实现了本金 50 倍的飞跃,如今掌舵国内顶尖的量化私募。
- 新茶饮界的“创业女神”:她成功打造了首个上市的新茶饮品牌(奈雪的茶),让“奶茶”成为了一种生活方式。
- 实业与投资的“长青树”:他创建了科瑞集团,在医疗、矿产、金融等多个领域都有极深造诣。
你还知道哪些深藏不露的江财校友?欢迎在评论区留言!