跳转到内容

量化策略的第一性原理

v1 2026-06-05 a28d61c

交易策略不是预测价格,而是在某个市场游戏中,利用信息优势、风险补偿或结构性约束,把对未来状态的判断转化为风险受控、成本可覆盖的交易动作。

更压缩地说:

Strategy=Market Game+Information+Pricing+Action Policy+Execution+Risk Control+Learning Loop\text{Strategy} = \text{Market Game} + \text{Information} + \text{Pricing} + \text{Action Policy} + \text{Execution} + \text{Risk Control} + \text{Learning Loop}

策略的核心不是:

data -> model -> pnl

而是:

market game
-> participants / flows
-> information
-> priced object
-> forecast / fair value
-> edge
-> action
-> execution
-> risk inventory
-> sizing
-> validation
-> attribution / monitoring
-> iteration

高频、指数增强、多头、对冲、统计套利、CTA、期权、maker、taker 不是本质不同的物种,而是这个统一决策系统在不同市场结构、时间尺度、成本结构和风险库存下的具体形态。

一个 signal 不是 strategy。

Signal 通常只是:

st=E[rt+hXt]s_t = E[r_{t+h} \mid X_t]

它回答的是:

给定当前信息,未来某个变量大概会怎样?

Strategy 要回答的是:

给定当前信息、可执行价格、交易成本、风险库存、资金约束和执行方式,我现在应该采取什么动作,做多少,怎么做,什么时候停?

所以策略不是单独的预测问题,而是不确定性下的动作选择问题。

在时刻 tt,观察状态 XtX_t,从可行动作集合 AtA_t 中选择交易动作 ata_t

at=argmaxaAtE[ΔV(a)Xt]TC(a)λR(a)CC(a)CP(a)a_t^* = \arg\max_{a \in A_t} E[\Delta V(a) \mid X_t] - TC(a) - \lambda R(a) - CC(a) - CP(a)

其中:

  • XtX_t 是当时可见的信息,包括价格、盘口、成交、财报、指数成分、资金流、波动率曲面、持仓状态、交易通道状态等;
  • AtA_t 是可行动作集合,包括 buy、sell、quote、cancel、hedge、rebalance、hold、reduce、stop;
  • E[ΔV(a)Xt]E[\Delta V(a) \mid X_t] 是动作带来的未来价值变化;
  • TC(a)TC(a) 是交易成本,包括 spread、fee、impact、slippage、borrow、funding、tax、delay、queue loss;
  • R(a)R(a) 是风险库存带来的惩罚,包括 beta、factor、inventory、liquidity、tail、basis、volatility、model risk;
  • CC(a)CC(a) 是资本成本和资金占用成本;
  • CP(a)CP(a) 是约束惩罚,包括仓位、杠杆、流动性、监管、风控、交易所规则和容量。

这个公式不是为了精确计算一切,而是提醒自己:预测只是输入,策略本体是动作策略。

任何策略都嵌在一个具体市场游戏里。没有市场结构,就没有策略语境。

先问:

  • 交易什么标的?
  • 撮合规则是什么?
  • tick size、手续费、rebate、涨跌停、保证金、交易时间是什么?
  • 是否可以做空、借券、融资、杠杆、跨市场交易?
  • 流动性集中在哪里?
  • 谁有速度优势、信息优势、成本优势或资产负债表优势?
  • 交易规则会不会让某些参与者被迫交易?

这个模块的输出不是一句“做股票”或“做 crypto”,而是:

  • tradable universe;
  • action space;
  • liquidity map;
  • fee / rebate model;
  • execution constraints;
  • regulatory constraints;
  • capacity constraints;
  • market microstructure assumptions。

同一个 signal 在不同市场游戏里的价值完全不同。一个期货盘口信号、一个小盘股日频信号、一个期权波动率信号,面对的是不同成本、不同风险库存、不同对手方和不同容量。

二、Participants / Flows:我赚谁的钱

Section titled “二、Participants / Flows:我赚谁的钱”

理解策略,要先理解钱从哪里来。

常见 edge source 包括:

  • 风险溢价:承担别人不愿意承担的波动、尾部、流动性、期限、杠杆或回撤;
  • 流动性补偿:在别人需要立刻成交时提供流动性;
  • 信息优势:更快、更准或更稳定地处理信息;
  • 行为偏差:利用过度反应、迟缓反应、追涨杀跌、止损压力或机构行为惯性;
  • 结构性约束:利用指数调仓、资金流、监管约束、做空约束、保证金约束、委托规则;
  • 执行优势:同样的观点,用更低成本、更高 fill quality、更少冲击来实现;
  • 组合构建优势:把弱 alpha 变成可承受、可分散、可扩容的组合收益。

如果回答不出来“赚谁的钱”,策略可能只是过拟合。

还要问第二层问题:

为什么这个机会没有被消灭?

可能答案包括:

  • 容量太小;
  • 风险太难持有;
  • 回撤体验差;
  • 交易成本高;
  • 基础设施门槛高;
  • 需要特殊数据;
  • 需要更强执行;
  • 需要长期资本;
  • 受监管、做空、杠杆或 mandate 约束;
  • 其他参与者知道机会存在,但不愿意或不能交易。

如果一个策略同时简单、容量大、风险小、收益高、竞争少,通常不可信。

三、Information:我到底看到了什么

Section titled “三、Information:我到底看到了什么”

信息决定策略上限。

常见信息包括:

  • tick、order book、trades;
  • bar、return、volume、volatility;
  • fundamentals、earnings、corporate actions;
  • factor data、index constituents、benchmark weights;
  • borrow cost、funding rate、margin;
  • options surface、Greeks、realized volatility;
  • macro、rates、credit、cross-asset signals;
  • news、filings、alternative data;
  • 自身 inventory、orders、fills、latency、rejections。

信息模块最重要的不是“多”,而是:

  • 是否 point-in-time;
  • 是否有 lookahead bias;
  • 是否有 survivorship bias;
  • 时间戳是否准确;
  • 当时是否真的可获得;
  • 更新频率是否匹配策略周期;
  • 数据质量是否会在 regime change 时退化;
  • 数据错误是否会直接触发错误交易。

没有干净、及时、可交易的信息,就没有可兑现的 edge。

四、Priced Object:策略到底在给什么定价

Section titled “四、Priced Object:策略到底在给什么定价”

不是所有策略都在给“资产本身”定价。更准确地说,策略是在给某个交易动作或风险库存定价。

可能的定价对象包括:

  • future return;
  • future mid-price;
  • residual return;
  • fill probability;
  • adverse selection;
  • volatility;
  • skew;
  • correlation;
  • basis;
  • liquidity;
  • market impact;
  • transaction cost;
  • inventory risk;
  • hedge ratio;
  • tracking error;
  • borrow cost;
  • funding cost;
  • tail risk。

所谓“定价”,本质是回答:

如果我现在采取这个动作,它的未来价值是否足以覆盖成本、风险和资本占用?

不同策略的差别,经常不是模型高级程度不同,而是定价对象不同。

五、Forecast / Fair Value:如何估计未来状态

Section titled “五、Forecast / Fair Value:如何估计未来状态”

Forecast 不等于“预测明天涨跌”。

它可以输出:

  • expected return;
  • probability of up move;
  • future mid-price move;
  • residual return;
  • volatility forecast;
  • spread convergence probability;
  • fill probability;
  • adverse selection probability;
  • impact estimate;
  • liquidity forecast;
  • tail probability。

Fair value 也是广义概念。

高频 maker 的 fair value 可能是:

FV=Mid+f(orderbook,trades,related instruments)FV = Mid + f(orderbook, trades, related\ instruments)

指数增强里的 fair value 是股票相对 benchmark 的预期 residual return。

期权里的 fair value 是未来分布、波动率曲面和 Greeks。

对冲里的 fair value 是 hedge ratio、basis、correlation 和 residual exposure。

所以 fair value 不是“资产真实价值”,而是当前交易决策所需的参考价值。

六、Edge:预测如何变成可交易收益

Section titled “六、Edge:预测如何变成可交易收益”

Edge 是连接预测和交易动作的桥。

单笔交易层面:

gross edge=E[future valueXt,a]current executable price\text{gross edge} = E[\text{future value} \mid X_t, a] - \text{current executable price}

扣除成本后:

net edge=gross edgetransaction costrisk chargecapital charge\text{net edge} = \text{gross edge} - \text{transaction cost} - \text{risk charge} - \text{capital charge}

只有当:

net edge>threshold\text{net edge} > \text{threshold}

才值得交易。

这里的 threshold 不是装饰项。它要覆盖模型误差、估计噪声、执行不确定性和极端情况下的安全边际。

不同层级的 edge 不要混在一起:

  • trade-level edge:这笔交易扣成本后是否值得做;
  • portfolio-level edge:这组仓位在相关性、风险预算和约束下是否值得持有;
  • business-level edge:这套策略扣除基础设施、融资、容量和尾部风险后是否值得经营。

很多策略 paper alpha 很高,但真实交易后消失,是因为只证明了 forecast,没有证明 net edge。

七、Action Policy:策略本体是动作规则

Section titled “七、Action Policy:策略本体是动作规则”

策略必须定义 action space。

常见动作包括:

  • buy;
  • sell;
  • quote;
  • cancel;
  • hedge;
  • rebalance;
  • hold;
  • reduce;
  • stop;
  • do nothing。

真正的策略要决定:

  • 做不做;
  • 做多少;
  • 用 taker 还是 maker;
  • 用什么订单类型;
  • 分几笔做;
  • 什么价格做;
  • 多久不成交就撤;
  • 是否同时对冲;
  • 是否超过风险预算;
  • 是否进入 no-trade region;
  • 什么时候认为逻辑坏了。

Action policy 比 signal 更接近策略本体。

一个 signal 可以对应很多策略:

  • 小仓位慢慢买;
  • 大仓位立刻买;
  • 只在成本低时买;
  • 等回撤后买;
  • 配对后买;
  • 用期权表达;
  • 不交易,只降低已有仓位。

策略质量取决于 signal 如何被转化为动作,而不只是 signal 本身有多强。

八、Cost / Execution:成本是市场对策略的收费

Section titled “八、Cost / Execution:成本是市场对策略的收费”

交易成本不是回测最后扣一个常数。

它包括:

  • spread;
  • fee;
  • rebate;
  • slippage;
  • market impact;
  • delay cost;
  • borrow cost;
  • funding cost;
  • tax;
  • opportunity cost;
  • queue loss;
  • adverse selection cost。

Execution 要回答:

我想交易,和我真实成交,是不是同一件事?

高频里:

  • 信号对了,但慢了 200 微秒,可能已经没钱赚;
  • 挂单赚了 spread,但被 toxic flow 选择性成交,可能亏更多;
  • 回测假设排队成交,但真实 queue position 根本轮不到。

中低频里:

  • 年化 10% 的 paper alpha 可能被换手成本吃完;
  • 小盘股因子可能有收益,但容量不足;
  • 做空组合可能被 borrow cost 和 recall risk 破坏;
  • 大资金调仓会把自己的 alpha 交易成 impact。

Execution 不是工程后处理,而是策略经济学的一部分。

九、Risk Inventory / Sizing:仓位决定策略寿命

Section titled “九、Risk Inventory / Sizing:仓位决定策略寿命”

Risk 不是附属模块,而是策略的一部分。

每个交易动作都会留下风险库存:

  • market beta;
  • sector exposure;
  • factor exposure;
  • inventory;
  • liquidity risk;
  • concentration;
  • leverage;
  • basis risk;
  • volatility exposure;
  • gamma / vega / theta;
  • borrow risk;
  • funding risk;
  • model risk;
  • data risk;
  • latency risk;
  • tail risk。

Sizing 不是把 signal 乘一个常数,而是把 edge、信心、波动、相关性、流动性、容量、回撤预算和尾部风险放在一起。

可以把仓位理解成:

size=f(edge,confidence,volatility,liquidity,correlation,drawdown budget,tail risk,capacity)\text{size} = f( \text{edge}, \text{confidence}, \text{volatility}, \text{liquidity}, \text{correlation}, \text{drawdown budget}, \text{tail risk}, \text{capacity} )

很多策略不是因为没有 alpha 死,而是因为:

  • 仓位太大;
  • 流动性不够;
  • 相关性在危机时上升;
  • 对冲失效;
  • 成本模型低估;
  • 保证金或融资条件变化;
  • 极端行情没有 kill switch。

成熟策略必须知道:

什么情况是正常亏损,什么情况是策略逻辑坏了。

十、Validation:回测是在验证假设

Section titled “十、Validation:回测是在验证假设”

回测的本质不是证明策略赚钱,而是回答:

这个策略在什么假设下赚钱?这些假设真实吗?

要验证:

  • 数据是否 point-in-time;
  • 是否有 lookahead bias;
  • 是否有 survivorship bias;
  • label 是否和交易周期匹配;
  • 成本模型是否真实;
  • fill model 是否真实;
  • latency 和 queue 是否真实;
  • liquidity constraint 是否真实;
  • capacity 是否真实;
  • regime split 下是否仍成立;
  • walk-forward 是否仍成立;
  • 参数是否过拟合;
  • 极端行情下是否可生存。

不同策略需要不同模拟精度。

高频需要:

  • order book replay;
  • queue simulation;
  • matching engine approximation;
  • latency simulation;
  • cancel delay;
  • fee / rebate;
  • exchange rules;
  • adverse selection model。

中低频需要:

  • point-in-time data;
  • corporate action adjustment;
  • rebalance simulation;
  • factor exposure;
  • borrow constraint;
  • cost and impact model;
  • liquidity and capacity constraint。

回测不是结论,而是假设审计工具。

十一、Attribution / Monitoring:上线后如何学习

Section titled “十一、Attribution / Monitoring:上线后如何学习”

没有 attribution,就不知道钱从哪里来,也不知道什么时候会失效。

Attribution 要回答:

  • 收益来自 alpha、beta、factor、sector、timing、spread、rebate、inventory、hedge 还是成本节省?
  • 亏损来自预测错误、执行退化、成本上升、风险暴露、流动性变化还是模型失效?
  • 赚钱的来源是否和原始假设一致?
  • 某个子模块坏了,还是市场机会本身消失了?

Monitoring 要跟踪:

  • PnL;
  • drawdown;
  • turnover;
  • fill rate;
  • slippage;
  • hit rate;
  • latency;
  • rejection;
  • cancel rate;
  • inventory;
  • exposure;
  • signal distribution;
  • feature drift;
  • alpha decay;
  • cost drift;
  • model confidence;
  • abnormal position;
  • stale data;
  • risk limit breach。

策略上线后,市场会变,数据会坏,交易通道会坏,成本会漂移,竞争会进入,模型会衰减。

所以 production 不是纯工程问题,而是策略生存问题。

策略形态定价对象主要 edge source主要成本 / 风险典型动作
高频 taker极短期 mid-price moveorder flow / 速度 / 短期信息spread、fee、impact、latency、adverse move主动吃单、快速退出、必要时对冲
高频 makerfill 条件下的未来价值liquidity provision、spread、rebateadverse selection、inventory、queue lossquote、cancel、skew、inventory control
指数增强相对 benchmark 的 residual return股票选择、约束优化、低换手tracking error、turnover、factor driftbenchmark 约束下调仓
多头策略风险调整后的资产收益beta、风险溢价、选股 alpha回撤、集中度、流动性、风格暴露配置权重、控制风险预算
市场中性对冲后的 residual alpha横截面 mispricing、factor residualborrow、short squeeze、hedge errorlong / short、beta 或行业中性
统计套利相对价格关系均值回复、市场分割、临时错价关系断裂、crowding、成本pair / basket spread trading
CTA / 趋势趋势延续和收益分布偏斜trend persistence、convex payoffwhipsaw、vol regime、容量volatility targeting、趋势跟随
期权 / 波动率未来分布和波动率曲面vol risk premium、convexity mispricingGreeks、tail、liquidity、model riskdelta hedge、vega/gamma/theta exposure

这个表的作用不是分类百科,而是提醒:任何策略都可以被翻译成同一组问题。

分析任何交易策略时,先填这张表。

  • 交易什么?
  • 规则是什么?
  • 主要约束是什么?
  • 容量在哪里受限?
  • 谁在交易?
  • 谁被迫交易?
  • 我赚谁的钱?
  • 为什么这个机会没有被消灭?
  • 用什么数据?
  • 是否 point-in-time?
  • 是否当时可获得?
  • 时间戳是否准确?
  • 数据坏了会怎样?
  • 定价的是 future return、volatility、fill probability、basis、tracking error、impact,还是别的对象?
  • 这个对象和最终 PnL 的关系是什么?
  • 预测什么 horizon?
  • label 怎么定义?
  • 预测是否稳定?
  • 衰减速度多快?
  • 在不同 regime 下是否成立?
  • gross edge 是什么?
  • transaction cost 怎么估?
  • risk charge 怎么估?
  • capital charge 怎么估?
  • no-trade threshold 是什么?
  • 可采取哪些动作?
  • 什么条件下交易?
  • 做多少?
  • 用什么订单类型?
  • 什么时候撤、减仓、对冲或停止?
  • spread、fee、impact、slippage、latency、borrow、funding 如何进入模型?
  • paper trade 和真实成交差在哪里?
  • fill model 是否可信?
  • 留下了什么风险库存?
  • 仓位如何决定?
  • 最大亏损、最大回撤、最大敞口、最大流动性消耗是什么?
  • 什么时候触发 kill switch?
  • 回测验证了哪些假设?
  • 哪些假设最脆弱?
  • 是否能 survive costs、delay、lower fill rate、worse slippage、regime split、capacity constraint?
  • 钱来自哪里?
  • 亏损来自哪里?
  • 上线后看哪些指标?
  • 什么情况说明策略坏了?
  • 下一步研究哪个模块?
  • 是信息不够、定价不准、成本低估、执行差、仓位错,还是风险定义错?
  • 本页把交易策略视为可重复执行的决策系统;纯主观交易也可以套用,但 action policy 和 validation 会更弱。
  • 本页默认策略需要真实交易落地,因此把成本、执行、容量、风控和监控视为策略本体,而不是附属工程。
  • 本页使用 broad quant language;不同市场的具体实现必须结合交易规则、数据可得性和执行基础设施重新定义。
  • 有些策略看起来不是预测,而是做市、套利或风险转移。回应是:它们仍然在预测条件分布,只是预测对象不是价格方向,而是 fill、adverse selection、spread capture、basis、volatility 或 risk compensation。
  • 有些长期策略更像资产配置,不像交易系统。回应是:只要有仓位、成本、风险预算和再平衡规则,它仍然可以被写成 action policy。
  • 统一框架可能牺牲策略细节。回应是:总框架只负责提出共同问题,具体策略应该拆成单独页面展开。
  • 当新增一个具体策略研究页时,检查它能否完整回答本页模板。
  • 当某个策略类型的细节超过本页承载范围时,拆成独立页面并在本页保留入口。
  • 当引入具体市场规则、成本参数、监管约束或实证结论时,补充 source trail。
  • 当发现某类策略不能被这个框架自然解释时,更新框架本身。
  • 本页当前是概念框架整理,不依赖特定市场数据、法规条文或实证结论。
  • 后续加入具体市场规则、成本估计、策略论文或交易所制度时,需要补充对应 primary source 或研究来源。