量化机器学习里“模型走捷径”的典型现象与应对方法

这个现象在量化里特别典型:模型会优先学“最容易降低 loss 的信号”,而这些信号往往是: 不可交易(跌停 / 停牌 / 流动性太差、成交冲击巨大) 不允许暴露(行业 / 风格 / beta 太强,后面优化器会剪掉) 看起来很准但其实是泄露 / 同步信息(时间戳没对齐、用到了收盘后才能知道的东西) 想让训练“无偏”(更…