跳转至


课程  因子投资  机器学习  Python  Poetry  ppw  tools  programming  Numpy  Pandas  pandas  算法  hdbscan  聚类  选股  Algo  minimum  numpy  回测  数据标准化  algo  FFT  模式识别  配对交易  GBDT  LightGBM  XGBoost  statistics  CDF  KS-Test  monte-carlo  VaR  过拟合  algorithms  machine learning  strategy  python  sklearn  pdf  概率  数学  面试题  量化交易  策略分类  风险管理  Info  interview  career  强化学习  监督学习  AI量化  复权  数据  tushare  akshare  xgboost  PCA  wavelet  时序事件归因  SHAP  Figures  Behavioral Economics  graduate  arma  garch  人物  职场  Quantopian  figure  Banz  金融行业  买方  卖方  story  量化传奇  rsi  zigzag  穹顶压力  因子  ESG  因子策略  投资  策略  pe  ORB  Xgboost  Alligator  Indicator  factor  alpha101  alpha  技术指标  wave  quant  algorithm  pearson  spearman  套利  LOF  白银  因子分析  Alphalens  涨停板  herd-behaviour  momentum  因子评估  review  SMC  聪明钱  trade  history  indicators  zscore  波动率  lightgbm  顶背离  另类数据  freshman  resources  others  AI  DeepSeek  network  量子计算  金融交易  IBM  weekly  进化论  logic-factor  machine-learning  neutralization  basics  LLT  backtest  backtrader  研报  papers  UBL  quantlib  jupyter-notebook  scikit-learn  pypinyin  qmt  xtquant  blog  static-site  duckdb  工具  colors  free resources  barra  world quant  Alpha  openbb  risk-management  llm  prompt  CANSLIM  Augment  arsenal  copilot  vscode  code  量化数据存储  hdf5  h5py  cursor  augment  trae  Jupyter  jupysql  pyarrow  parquet  数据源  quantstats  几何收益  实盘  clickhouse  polars  滑动窗口  notebook  sqlite  sqlite-utils  fastlite  大数据  PyArrow  UV  Pydantic  Engineering  redis  remote-agent  AI-tools  Moonshot  回测,研报,tushare  dividend 

TCN番外:为什么AI炒股没那么简单?

最后更新: 2026-03-23


TCN番外:为什么AI炒股没那么简单?

看完TCN原理后,你必须知道的实战真相


引子:一个残酷的对比

你学了TCN原理,兴冲冲地写了个模型:

1
2
3
回测准确率:85%
模拟盘收益:年化60%
你心想:财务自由指日可待!

然后你投入实盘:

1
2
3
第一个月:-15%
第二个月:-20%
第三个月:模型彻底失效

💡 为什么? 因为你不知道金融市场的真相。


第一章:金融市场的本质问题

1.1 反身性——模型的自我毁灭

核心观点: 金融市场的理论/模型,会被使用者的行为自我强化或消解。

例子:假设你开发了一个"均线多头排列必涨"的模型

阶段 使用人数 发生了什么 收益率
第一阶段 只有你用 模型捕捉上涨信号,你买入,确实涨了 +20% ✅
第二阶段 10个人用 多人同时买入,股价被推高,还能涨 +15% ✅
第三阶段 1000个人用 所有人都知道要涨,预期被透支,反而下跌 -10% ❌

结论: 模型用的人越多,自己就越失效 —— 这就是索罗斯说的"反身性"

1.2 标签歧义——同样的K线,完全不同的命运

核心观点: 金融数据的标签高度不确定,噪声远高于文本、图像。

对比:

数据类型 确定性 例子
文本 99% "我饿了" = 想吃饭
图像 99% 你的人脸照片,全世界只有你
金融 50% 同样的K线,不同事件下走势完全相反

真实案例:

昨天: - 某股票走出"黄金坑+均线多头"的完美看涨形态 - 按历史数据:应该大涨 - 你打标签:"上涨" ✅

今天凌晨: - 美联储突然宣布"不降息反而加息" - 全球股市暴跌 - 这只股票直接低开低走 - 同一个形态,今天打标签:"下跌" ❌

TCN的困境: - 训练集里,同一个形态有两种标签 - 模型权重来回抵消 - 学不到稳定规律


第二章:TCN在金融中的技术局限

2.1 空洞采样与经济周期错位

核心观点: TCN固定指数步长的采样,和真实经济周期错位。

TCN的采样窗口:

1
2
3
4
5
6
7
Layer 1:  2天
Layer 2:  4天
Layer 3:  8天
Layer 4:  16天
Layer 5:  32天
Layer 6:  64天  ≈ 季度(财报周期)
Layer 7:  128天 ≈ 半年

人类经济活动周期: - 工厂:按月排产 - 基金:按月排名 - 散户:习惯看"月线""周线"

错位问题: - 你想分析"月度收益" - TCN只能用60天或64天近似 - 永远无法精准对齐1月1日到1月31日的自然月窗口 - 财报在1月15日发布,TCN的窗口可能从1月10日到3月10日 - 完全错过关键节点

2.2 没有日历概念——大小月、节假日全乱套

核心观点: TCN没有日历概念,无法处理真实交易场景。

大小月问题:

1
2
2025年2月:18个交易日
2025年3月:22个交易日

TCN只会机械地按"连续20天"分组: - 把2月后半段和3月前半段硬凑成一个"月" - 完全不符合真实的月度因子收益分析

周度问题:

1
2
自然周:周一到周五(5个交易日)
周末:休市

TCN用"连续5天"采样: - 遇到春节、国庆等节假日 - 把周末和节假日也算进窗口 - 无法精准对齐"周一到周五"的交易周

结果: - 模型学的是"连续5天" - 但真实市场是"5个交易日+2天休市" - 时间结构完全不对

2.3 噪声处理能力弱——保留太多无效波动

核心观点: TCN保留过多过程噪声,不像K线那样做周期聚合降噪。

传统月K线的做法:

1
2
3
1月1日开盘价:100元
1月31日收盘价:110元
中间30天的波动:全部忽略

只保留月初和月末,中间的日内涨跌视为噪声。

TCN的做法:

1
2
3
4
5
6
哪怕用空洞卷积,还是会把:
- 每5天的价格波动
- 每10天的情绪波动
- 散户追涨杀跌的短期行为
- 日内随机波动
全部喂给模型

后果: - 放大了金融数据的干扰 - 模型被噪声淹没 - 学不到真正的长期规律

2.4 监督学习的本质缺陷

核心观点: TCN属于监督学习,无法解决标签歧义和反身性问题。

训练场景: - 你用TCN训练"过去64天形态预测未来7天走势" - 训练集里有1000次"形态A" - 其中600次涨、400次跌

模型学到的:

1
"形态A有60%概率涨"

实盘场景: - 遇到"形态A + 美联储加息" - 模型还是按60%概率判断上涨 - 结果:直接踩雷,暴跌

问题所在: - 模型学不到"外部事件会颠覆历史规律" - 它只知道"形态A历史上60%涨" - 不知道"美联储加息时,形态A100%跌"


第三章:XGBoost在金融中的对比

3.1 直接输入价格完全无效

核心观点: 直接喂价格会让模型学到"前一日价格≈后一日价格"的无意义规律。

实验: - 输入:茅台过去10天收盘价 - 目标:预测第11天价格

XGBoost的发现:

1
2
3
茅台99%的交易日波动在 ±1% 以内
最佳策略:直接用第10天的价格当预测值
损失函数最小

结果: - 预测准确率很高 - 但对交易毫无价值 - ±1%波动覆盖不了手续费 - 更抓不到5%以上的大涨大跌

3.2 必须依赖强特征工程

核心观点: XGBoost要学人工因子,相当于升级版多因子模型。

构造50个因子:

1
2
3
4
5
A因子:过去20天涨幅超过10%(动量因子)
B因子:市盈率低于10倍(估值因子)
C因子:成交量放大2倍(情绪因子)
D因子:MACD金叉(技术因子)
...

传统多因子模型: - 线性回归 - 假设:A+B+C 线性相加决定涨跌

XGBoost的优势: - 能学到非线性关系 - "只有当A和B同时满足时,C才会触发上涨" - 比如:"低估值+高动量+放量"才会涨

但问题还在: - 还是监督学习 - 还是怕噪声 - 特征错了就全错

3.3 XGBoost仍无法解决的核心问题

噪声约束: - 你构造了"美联储加息前必跌"的因子 - 但某次加息后市场因为"利空出尽"反而大涨 - 训练集里同时出现"涨"和"跌"的标签 - 模型学不到稳定规律

特征依赖: - 如果你的因子是"未来30天涨幅"(数据泄露) - 回测表现极好 - 实盘完全失效 - 特征错了,模型再强也没用


第四章:更合理的方向——强化学习

核心观点: 强化学习以长期回报为目标,能容忍短期噪声。

监督学习 vs 强化学习:

对比项 监督学习(TCN/XGBoost) 强化学习
目标 预测明天涨不涨 持有30天,总收益正还是负
标签 需要明确标签 不需要标签,只看回报
噪声 对噪声敏感 能容忍短期噪声
外部事件 学不到影响 通过回报反馈自动适应

强化学习的做法: - 不预测"明天涨不涨" - 让模型"持有30天,看总收益" - 哪怕中间某几天暴跌 - 只要30天后总收益是正的 - 模型就会记住"当时的持仓策略是对的"

优势: - 不用管某一天的标签是涨还是跌 - 只看长期结果 - 能忽略短期噪声和外部冲击


第五章:AI量化的现实天花板

5.1 资金规模魔咒

核心观点: 大资金会破坏自己的交易信号,策略失效。

资金规模 策略 结果
小资金(100万) 放量突破10日线时买入 不影响价格,信号有效 ✅
大资金(10亿) 同样的策略 一买入就拉涨停,信号消失 ❌

结论: 策略容量有限,规模大了,自己的交易就是市场

5.2 顶尖AI人才成本极高

现实对比:

1
2
OpenAI核心研究员年薪:大几千万美金 + 股份
独立量化团队一年管理费:几百万人民币

结果: - 雇不起顶尖人才 - 技术上永远落后一步 - 用开源模型 vs 用自研顶级模型 - 差距巨大

5.3 大机构盈利依赖规则套利

核心观点: 大机构靠制度漏洞赚钱,不是纯模型。

真实案例:

1
2
3
4
5
6
7
8
早期融券规则:
- 当天融的券,当天可以卖出
- 机构能融到优质券源,散户融不到

套利策略:
1. 先把股价拉涨停
2. 当天融券卖出
3. 实现T+0套利

结果: - 证监会堵住漏洞 - 要求"当天融的券次日才能卖" - 套利策略直接失效

结论: 赚钱靠的是规则,不是模型 —— 规则一变,策略就死


最终总结

TCN的局限

❌ 用64天近似季度、20天近似月,和真实自然月/周对不上
❌ 还保留日内噪声
❌ 监督学习框架学不到稳定规律

XGBoost的局限

❌ 直接喂价格会学到"明天≈今天"
❌ 必须构造动量/估值等因子
❌ 但还是怕美联储消息这种噪声
❌ 特征错了就全错

更优方向

强化学习:不管明天涨跌,看30天总收益,更抗噪声

现实约束

约束 说明
资金规模 10亿资金一买就涨停,模型信号没了
人才成本 顶级人才太贵雇不起
规则套利 大机构靠融券套利赚钱,还会被监管封死

给新手的建议

1. 先学原理,再学局限

1
2
TCN原理很重要
但知道它不能做什么更重要

2. 从小资金开始

1
2
策略容量是真实存在的限制
小资金反而有优势

3. 关注强化学习

1
2
比监督学习更适合金融场景
虽然更难,但更值得

4. 别迷信模型

1
2
金融市场的本质是博弈
模型只是工具,不是圣杯

💡 看完这篇,你应该对AI量化有了更清醒的认识。

TCN是好工具,但工具不能解决所有问题。

真正的竞争力,在于你对市场的理解,而不是模型本身。