量化策略的第一性原理
a28d61c 交易策略不是预测价格,而是在某个市场游戏中,利用信息优势、风险补偿或结构性约束,把对未来状态的判断转化为风险受控、成本可覆盖的交易动作。
更压缩地说:
策略的核心不是:
data -> model -> pnl而是:
market game-> participants / flows-> information-> priced object-> forecast / fair value-> edge-> action-> execution-> risk inventory-> sizing-> validation-> attribution / monitoring-> iteration高频、指数增强、多头、对冲、统计套利、CTA、期权、maker、taker 不是本质不同的物种,而是这个统一决策系统在不同市场结构、时间尺度、成本结构和风险库存下的具体形态。
一个 signal 不是 strategy。
Signal 通常只是:
它回答的是:
给定当前信息,未来某个变量大概会怎样?
Strategy 要回答的是:
给定当前信息、可执行价格、交易成本、风险库存、资金约束和执行方式,我现在应该采取什么动作,做多少,怎么做,什么时候停?
所以策略不是单独的预测问题,而是不确定性下的动作选择问题。
在时刻 ,观察状态 ,从可行动作集合 中选择交易动作 :
其中:
- 是当时可见的信息,包括价格、盘口、成交、财报、指数成分、资金流、波动率曲面、持仓状态、交易通道状态等;
- 是可行动作集合,包括 buy、sell、quote、cancel、hedge、rebalance、hold、reduce、stop;
- 是动作带来的未来价值变化;
- 是交易成本,包括 spread、fee、impact、slippage、borrow、funding、tax、delay、queue loss;
- 是风险库存带来的惩罚,包括 beta、factor、inventory、liquidity、tail、basis、volatility、model risk;
- 是资本成本和资金占用成本;
- 是约束惩罚,包括仓位、杠杆、流动性、监管、风控、交易所规则和容量。
这个公式不是为了精确计算一切,而是提醒自己:预测只是输入,策略本体是动作策略。
一、Market Game:先理解市场游戏
Section titled “一、Market Game:先理解市场游戏”任何策略都嵌在一个具体市场游戏里。没有市场结构,就没有策略语境。
先问:
- 交易什么标的?
- 撮合规则是什么?
- tick size、手续费、rebate、涨跌停、保证金、交易时间是什么?
- 是否可以做空、借券、融资、杠杆、跨市场交易?
- 流动性集中在哪里?
- 谁有速度优势、信息优势、成本优势或资产负债表优势?
- 交易规则会不会让某些参与者被迫交易?
这个模块的输出不是一句“做股票”或“做 crypto”,而是:
- tradable universe;
- action space;
- liquidity map;
- fee / rebate model;
- execution constraints;
- regulatory constraints;
- capacity constraints;
- market microstructure assumptions。
同一个 signal 在不同市场游戏里的价值完全不同。一个期货盘口信号、一个小盘股日频信号、一个期权波动率信号,面对的是不同成本、不同风险库存、不同对手方和不同容量。
二、Participants / Flows:我赚谁的钱
Section titled “二、Participants / Flows:我赚谁的钱”理解策略,要先理解钱从哪里来。
常见 edge source 包括:
- 风险溢价:承担别人不愿意承担的波动、尾部、流动性、期限、杠杆或回撤;
- 流动性补偿:在别人需要立刻成交时提供流动性;
- 信息优势:更快、更准或更稳定地处理信息;
- 行为偏差:利用过度反应、迟缓反应、追涨杀跌、止损压力或机构行为惯性;
- 结构性约束:利用指数调仓、资金流、监管约束、做空约束、保证金约束、委托规则;
- 执行优势:同样的观点,用更低成本、更高 fill quality、更少冲击来实现;
- 组合构建优势:把弱 alpha 变成可承受、可分散、可扩容的组合收益。
如果回答不出来“赚谁的钱”,策略可能只是过拟合。
还要问第二层问题:
为什么这个机会没有被消灭?
可能答案包括:
- 容量太小;
- 风险太难持有;
- 回撤体验差;
- 交易成本高;
- 基础设施门槛高;
- 需要特殊数据;
- 需要更强执行;
- 需要长期资本;
- 受监管、做空、杠杆或 mandate 约束;
- 其他参与者知道机会存在,但不愿意或不能交易。
如果一个策略同时简单、容量大、风险小、收益高、竞争少,通常不可信。
三、Information:我到底看到了什么
Section titled “三、Information:我到底看到了什么”信息决定策略上限。
常见信息包括:
- tick、order book、trades;
- bar、return、volume、volatility;
- fundamentals、earnings、corporate actions;
- factor data、index constituents、benchmark weights;
- borrow cost、funding rate、margin;
- options surface、Greeks、realized volatility;
- macro、rates、credit、cross-asset signals;
- news、filings、alternative data;
- 自身 inventory、orders、fills、latency、rejections。
信息模块最重要的不是“多”,而是:
- 是否 point-in-time;
- 是否有 lookahead bias;
- 是否有 survivorship bias;
- 时间戳是否准确;
- 当时是否真的可获得;
- 更新频率是否匹配策略周期;
- 数据质量是否会在 regime change 时退化;
- 数据错误是否会直接触发错误交易。
没有干净、及时、可交易的信息,就没有可兑现的 edge。
四、Priced Object:策略到底在给什么定价
Section titled “四、Priced Object:策略到底在给什么定价”不是所有策略都在给“资产本身”定价。更准确地说,策略是在给某个交易动作或风险库存定价。
可能的定价对象包括:
- future return;
- future mid-price;
- residual return;
- fill probability;
- adverse selection;
- volatility;
- skew;
- correlation;
- basis;
- liquidity;
- market impact;
- transaction cost;
- inventory risk;
- hedge ratio;
- tracking error;
- borrow cost;
- funding cost;
- tail risk。
所谓“定价”,本质是回答:
如果我现在采取这个动作,它的未来价值是否足以覆盖成本、风险和资本占用?
不同策略的差别,经常不是模型高级程度不同,而是定价对象不同。
五、Forecast / Fair Value:如何估计未来状态
Section titled “五、Forecast / Fair Value:如何估计未来状态”Forecast 不等于“预测明天涨跌”。
它可以输出:
- expected return;
- probability of up move;
- future mid-price move;
- residual return;
- volatility forecast;
- spread convergence probability;
- fill probability;
- adverse selection probability;
- impact estimate;
- liquidity forecast;
- tail probability。
Fair value 也是广义概念。
高频 maker 的 fair value 可能是:
指数增强里的 fair value 是股票相对 benchmark 的预期 residual return。
期权里的 fair value 是未来分布、波动率曲面和 Greeks。
对冲里的 fair value 是 hedge ratio、basis、correlation 和 residual exposure。
所以 fair value 不是“资产真实价值”,而是当前交易决策所需的参考价值。
六、Edge:预测如何变成可交易收益
Section titled “六、Edge:预测如何变成可交易收益”Edge 是连接预测和交易动作的桥。
单笔交易层面:
扣除成本后:
只有当:
才值得交易。
这里的 threshold 不是装饰项。它要覆盖模型误差、估计噪声、执行不确定性和极端情况下的安全边际。
不同层级的 edge 不要混在一起:
- trade-level edge:这笔交易扣成本后是否值得做;
- portfolio-level edge:这组仓位在相关性、风险预算和约束下是否值得持有;
- business-level edge:这套策略扣除基础设施、融资、容量和尾部风险后是否值得经营。
很多策略 paper alpha 很高,但真实交易后消失,是因为只证明了 forecast,没有证明 net edge。
七、Action Policy:策略本体是动作规则
Section titled “七、Action Policy:策略本体是动作规则”策略必须定义 action space。
常见动作包括:
- buy;
- sell;
- quote;
- cancel;
- hedge;
- rebalance;
- hold;
- reduce;
- stop;
- do nothing。
真正的策略要决定:
- 做不做;
- 做多少;
- 用 taker 还是 maker;
- 用什么订单类型;
- 分几笔做;
- 什么价格做;
- 多久不成交就撤;
- 是否同时对冲;
- 是否超过风险预算;
- 是否进入 no-trade region;
- 什么时候认为逻辑坏了。
Action policy 比 signal 更接近策略本体。
一个 signal 可以对应很多策略:
- 小仓位慢慢买;
- 大仓位立刻买;
- 只在成本低时买;
- 等回撤后买;
- 配对后买;
- 用期权表达;
- 不交易,只降低已有仓位。
策略质量取决于 signal 如何被转化为动作,而不只是 signal 本身有多强。
八、Cost / Execution:成本是市场对策略的收费
Section titled “八、Cost / Execution:成本是市场对策略的收费”交易成本不是回测最后扣一个常数。
它包括:
- spread;
- fee;
- rebate;
- slippage;
- market impact;
- delay cost;
- borrow cost;
- funding cost;
- tax;
- opportunity cost;
- queue loss;
- adverse selection cost。
Execution 要回答:
我想交易,和我真实成交,是不是同一件事?
高频里:
- 信号对了,但慢了 200 微秒,可能已经没钱赚;
- 挂单赚了 spread,但被 toxic flow 选择性成交,可能亏更多;
- 回测假设排队成交,但真实 queue position 根本轮不到。
中低频里:
- 年化 10% 的 paper alpha 可能被换手成本吃完;
- 小盘股因子可能有收益,但容量不足;
- 做空组合可能被 borrow cost 和 recall risk 破坏;
- 大资金调仓会把自己的 alpha 交易成 impact。
Execution 不是工程后处理,而是策略经济学的一部分。
九、Risk Inventory / Sizing:仓位决定策略寿命
Section titled “九、Risk Inventory / Sizing:仓位决定策略寿命”Risk 不是附属模块,而是策略的一部分。
每个交易动作都会留下风险库存:
- market beta;
- sector exposure;
- factor exposure;
- inventory;
- liquidity risk;
- concentration;
- leverage;
- basis risk;
- volatility exposure;
- gamma / vega / theta;
- borrow risk;
- funding risk;
- model risk;
- data risk;
- latency risk;
- tail risk。
Sizing 不是把 signal 乘一个常数,而是把 edge、信心、波动、相关性、流动性、容量、回撤预算和尾部风险放在一起。
可以把仓位理解成:
很多策略不是因为没有 alpha 死,而是因为:
- 仓位太大;
- 流动性不够;
- 相关性在危机时上升;
- 对冲失效;
- 成本模型低估;
- 保证金或融资条件变化;
- 极端行情没有 kill switch。
成熟策略必须知道:
什么情况是正常亏损,什么情况是策略逻辑坏了。
十、Validation:回测是在验证假设
Section titled “十、Validation:回测是在验证假设”回测的本质不是证明策略赚钱,而是回答:
这个策略在什么假设下赚钱?这些假设真实吗?
要验证:
- 数据是否 point-in-time;
- 是否有 lookahead bias;
- 是否有 survivorship bias;
- label 是否和交易周期匹配;
- 成本模型是否真实;
- fill model 是否真实;
- latency 和 queue 是否真实;
- liquidity constraint 是否真实;
- capacity 是否真实;
- regime split 下是否仍成立;
- walk-forward 是否仍成立;
- 参数是否过拟合;
- 极端行情下是否可生存。
不同策略需要不同模拟精度。
高频需要:
- order book replay;
- queue simulation;
- matching engine approximation;
- latency simulation;
- cancel delay;
- fee / rebate;
- exchange rules;
- adverse selection model。
中低频需要:
- point-in-time data;
- corporate action adjustment;
- rebalance simulation;
- factor exposure;
- borrow constraint;
- cost and impact model;
- liquidity and capacity constraint。
回测不是结论,而是假设审计工具。
十一、Attribution / Monitoring:上线后如何学习
Section titled “十一、Attribution / Monitoring:上线后如何学习”没有 attribution,就不知道钱从哪里来,也不知道什么时候会失效。
Attribution 要回答:
- 收益来自 alpha、beta、factor、sector、timing、spread、rebate、inventory、hedge 还是成本节省?
- 亏损来自预测错误、执行退化、成本上升、风险暴露、流动性变化还是模型失效?
- 赚钱的来源是否和原始假设一致?
- 某个子模块坏了,还是市场机会本身消失了?
Monitoring 要跟踪:
- PnL;
- drawdown;
- turnover;
- fill rate;
- slippage;
- hit rate;
- latency;
- rejection;
- cancel rate;
- inventory;
- exposure;
- signal distribution;
- feature drift;
- alpha decay;
- cost drift;
- model confidence;
- abnormal position;
- stale data;
- risk limit breach。
策略上线后,市场会变,数据会坏,交易通道会坏,成本会漂移,竞争会进入,模型会衰减。
所以 production 不是纯工程问题,而是策略生存问题。
十二、用统一框架看常见策略
Section titled “十二、用统一框架看常见策略”| 策略形态 | 定价对象 | 主要 edge source | 主要成本 / 风险 | 典型动作 |
|---|---|---|---|---|
| 高频 taker | 极短期 mid-price move | order flow / 速度 / 短期信息 | spread、fee、impact、latency、adverse move | 主动吃单、快速退出、必要时对冲 |
| 高频 maker | fill 条件下的未来价值 | liquidity provision、spread、rebate | adverse selection、inventory、queue loss | quote、cancel、skew、inventory control |
| 指数增强 | 相对 benchmark 的 residual return | 股票选择、约束优化、低换手 | tracking error、turnover、factor drift | benchmark 约束下调仓 |
| 多头策略 | 风险调整后的资产收益 | beta、风险溢价、选股 alpha | 回撤、集中度、流动性、风格暴露 | 配置权重、控制风险预算 |
| 市场中性 | 对冲后的 residual alpha | 横截面 mispricing、factor residual | borrow、short squeeze、hedge error | long / short、beta 或行业中性 |
| 统计套利 | 相对价格关系 | 均值回复、市场分割、临时错价 | 关系断裂、crowding、成本 | pair / basket spread trading |
| CTA / 趋势 | 趋势延续和收益分布偏斜 | trend persistence、convex payoff | whipsaw、vol regime、容量 | volatility targeting、趋势跟随 |
| 期权 / 波动率 | 未来分布和波动率曲面 | vol risk premium、convexity mispricing | Greeks、tail、liquidity、model risk | delta hedge、vega/gamma/theta exposure |
这个表的作用不是分类百科,而是提醒:任何策略都可以被翻译成同一组问题。
十三、通用策略审查模板
Section titled “十三、通用策略审查模板”分析任何交易策略时,先填这张表。
1. Market Game
Section titled “1. Market Game”- 交易什么?
- 规则是什么?
- 主要约束是什么?
- 容量在哪里受限?
2. Participants / Flows
Section titled “2. Participants / Flows”- 谁在交易?
- 谁被迫交易?
- 我赚谁的钱?
- 为什么这个机会没有被消灭?
3. Information Set
Section titled “3. Information Set”- 用什么数据?
- 是否 point-in-time?
- 是否当时可获得?
- 时间戳是否准确?
- 数据坏了会怎样?
4. Priced Object
Section titled “4. Priced Object”- 定价的是 future return、volatility、fill probability、basis、tracking error、impact,还是别的对象?
- 这个对象和最终 PnL 的关系是什么?
5. Forecast / Fair Value
Section titled “5. Forecast / Fair Value”- 预测什么 horizon?
- label 怎么定义?
- 预测是否稳定?
- 衰减速度多快?
- 在不同 regime 下是否成立?
6. Edge Formula
Section titled “6. Edge Formula”- gross edge 是什么?
- transaction cost 怎么估?
- risk charge 怎么估?
- capital charge 怎么估?
- no-trade threshold 是什么?
7. Action Policy
Section titled “7. Action Policy”- 可采取哪些动作?
- 什么条件下交易?
- 做多少?
- 用什么订单类型?
- 什么时候撤、减仓、对冲或停止?
8. Cost / Execution
Section titled “8. Cost / Execution”- spread、fee、impact、slippage、latency、borrow、funding 如何进入模型?
- paper trade 和真实成交差在哪里?
- fill model 是否可信?
9. Risk Inventory / Sizing
Section titled “9. Risk Inventory / Sizing”- 留下了什么风险库存?
- 仓位如何决定?
- 最大亏损、最大回撤、最大敞口、最大流动性消耗是什么?
- 什么时候触发 kill switch?
10. Validation
Section titled “10. Validation”- 回测验证了哪些假设?
- 哪些假设最脆弱?
- 是否能 survive costs、delay、lower fill rate、worse slippage、regime split、capacity constraint?
11. Attribution / Monitoring
Section titled “11. Attribution / Monitoring”- 钱来自哪里?
- 亏损来自哪里?
- 上线后看哪些指标?
- 什么情况说明策略坏了?
12. Iteration
Section titled “12. Iteration”- 下一步研究哪个模块?
- 是信息不够、定价不准、成本低估、执行差、仓位错,还是风险定义错?
Assumptions
Section titled “Assumptions”- 本页把交易策略视为可重复执行的决策系统;纯主观交易也可以套用,但 action policy 和 validation 会更弱。
- 本页默认策略需要真实交易落地,因此把成本、执行、容量、风控和监控视为策略本体,而不是附属工程。
- 本页使用 broad quant language;不同市场的具体实现必须结合交易规则、数据可得性和执行基础设施重新定义。
Counterarguments
Section titled “Counterarguments”- 有些策略看起来不是预测,而是做市、套利或风险转移。回应是:它们仍然在预测条件分布,只是预测对象不是价格方向,而是 fill、adverse selection、spread capture、basis、volatility 或 risk compensation。
- 有些长期策略更像资产配置,不像交易系统。回应是:只要有仓位、成本、风险预算和再平衡规则,它仍然可以被写成 action policy。
- 统一框架可能牺牲策略细节。回应是:总框架只负责提出共同问题,具体策略应该拆成单独页面展开。
Update Triggers
Section titled “Update Triggers”- 当新增一个具体策略研究页时,检查它能否完整回答本页模板。
- 当某个策略类型的细节超过本页承载范围时,拆成独立页面并在本页保留入口。
- 当引入具体市场规则、成本参数、监管约束或实证结论时,补充 source trail。
- 当发现某类策略不能被这个框架自然解释时,更新框架本身。
Related Notes
Section titled “Related Notes”Source Trail
Section titled “Source Trail”- 本页当前是概念框架整理,不依赖特定市场数据、法规条文或实证结论。
- 后续加入具体市场规则、成本估计、策略论文或交易所制度时,需要补充对应 primary source 或研究来源。