量化策略的第一性原理

v1 2026-06-05 a28d61c

一句话总结

交易策略不是预测价格，而是在某个市场游戏中，利用信息优势、风险补偿或结构性约束，把对未来状态的判断转化为风险受控、成本可覆盖的交易动作。

更压缩地说：

\text{Strategy} = \text{Market Game} + \text{Information} + \text{Pricing} + \text{Action Policy} + \text{Execution} + \text{Risk Control} + \text{Learning Loop}

策略的核心不是：

data -> model -> pnl

而是：

market game
-> participants / flows
-> information
-> priced object
-> forecast / fair value
-> edge
-> action
-> execution
-> risk inventory
-> sizing
-> validation
-> attribution / monitoring
-> iteration

高频、指数增强、多头、对冲、统计套利、CTA、期权、maker、taker 不是本质不同的物种，而是这个统一决策系统在不同市场结构、时间尺度、成本结构和风险库存下的具体形态。

核心命题

一个 signal 不是 strategy。

Signal 通常只是：

s_t = E[r_{t+h} \mid X_t]

它回答的是：

给定当前信息，未来某个变量大概会怎样？

Strategy 要回答的是：

给定当前信息、可执行价格、交易成本、风险库存、资金约束和执行方式，我现在应该采取什么动作，做多少，怎么做，什么时候停？

所以策略不是单独的预测问题，而是不确定性下的动作选择问题。

在时刻 $t$ ，观察状态 $X_t$ ，从可行动作集合 $A_t$ 中选择交易动作 $a_t$ ：

a_t^* = \arg\max_{a \in A_t} E[\Delta V(a) \mid X_t] - TC(a) - \lambda R(a) - CC(a) - CP(a)

其中：

$X_t$ 是当时可见的信息，包括价格、盘口、成交、财报、指数成分、资金流、波动率曲面、持仓状态、交易通道状态等；
$A_t$ 是可行动作集合，包括 buy、sell、quote、cancel、hedge、rebalance、hold、reduce、stop；
$E[\Delta V(a) \mid X_t]$ 是动作带来的未来价值变化；
$TC(a)$ 是交易成本，包括 spread、fee、impact、slippage、borrow、funding、tax、delay、queue loss；
$R(a)$ 是风险库存带来的惩罚，包括 beta、factor、inventory、liquidity、tail、basis、volatility、model risk；
$CC(a)$ 是资本成本和资金占用成本；
$CP(a)$ 是约束惩罚，包括仓位、杠杆、流动性、监管、风控、交易所规则和容量。

这个公式不是为了精确计算一切，而是提醒自己：预测只是输入，策略本体是动作策略。

一、Market Game：先理解市场游戏

任何策略都嵌在一个具体市场游戏里。没有市场结构，就没有策略语境。

先问：

交易什么标的？
撮合规则是什么？
tick size、手续费、rebate、涨跌停、保证金、交易时间是什么？
是否可以做空、借券、融资、杠杆、跨市场交易？
流动性集中在哪里？
谁有速度优势、信息优势、成本优势或资产负债表优势？
交易规则会不会让某些参与者被迫交易？

这个模块的输出不是一句“做股票”或“做 crypto”，而是：

tradable universe；
action space；
liquidity map；
fee / rebate model；
execution constraints；
regulatory constraints；
capacity constraints；
market microstructure assumptions。

同一个 signal 在不同市场游戏里的价值完全不同。一个期货盘口信号、一个小盘股日频信号、一个期权波动率信号，面对的是不同成本、不同风险库存、不同对手方和不同容量。

二、Participants / Flows：我赚谁的钱

理解策略，要先理解钱从哪里来。

常见 edge source 包括：

风险溢价：承担别人不愿意承担的波动、尾部、流动性、期限、杠杆或回撤；
流动性补偿：在别人需要立刻成交时提供流动性；
信息优势：更快、更准或更稳定地处理信息；
行为偏差：利用过度反应、迟缓反应、追涨杀跌、止损压力或机构行为惯性；
结构性约束：利用指数调仓、资金流、监管约束、做空约束、保证金约束、委托规则；
执行优势：同样的观点，用更低成本、更高 fill quality、更少冲击来实现；
组合构建优势：把弱 alpha 变成可承受、可分散、可扩容的组合收益。

如果回答不出来“赚谁的钱”，策略可能只是过拟合。

还要问第二层问题：

为什么这个机会没有被消灭？

可能答案包括：

容量太小；
风险太难持有；
回撤体验差；
交易成本高；
基础设施门槛高；
需要特殊数据；
需要更强执行；
需要长期资本；
受监管、做空、杠杆或 mandate 约束；
其他参与者知道机会存在，但不愿意或不能交易。

如果一个策略同时简单、容量大、风险小、收益高、竞争少，通常不可信。

三、Information：我到底看到了什么

信息决定策略上限。

常见信息包括：

tick、order book、trades；
bar、return、volume、volatility；
fundamentals、earnings、corporate actions；
factor data、index constituents、benchmark weights；
borrow cost、funding rate、margin；
options surface、Greeks、realized volatility；
macro、rates、credit、cross-asset signals；
news、filings、alternative data；
自身 inventory、orders、fills、latency、rejections。

信息模块最重要的不是“多”，而是：

是否 point-in-time；
是否有 lookahead bias；
是否有 survivorship bias；
时间戳是否准确；
当时是否真的可获得；
更新频率是否匹配策略周期；
数据质量是否会在 regime change 时退化；
数据错误是否会直接触发错误交易。

没有干净、及时、可交易的信息，就没有可兑现的 edge。

四、Priced Object：策略到底在给什么定价

不是所有策略都在给“资产本身”定价。更准确地说，策略是在给某个交易动作或风险库存定价。

可能的定价对象包括：

future return；
future mid-price；
residual return；
fill probability；
adverse selection；
volatility；
skew；
correlation；
basis；
liquidity；
market impact；
transaction cost；
inventory risk；
hedge ratio；
tracking error；
borrow cost；
funding cost；
tail risk。

所谓“定价”，本质是回答：

如果我现在采取这个动作，它的未来价值是否足以覆盖成本、风险和资本占用？

不同策略的差别，经常不是模型高级程度不同，而是定价对象不同。

五、Forecast / Fair Value：如何估计未来状态

Forecast 不等于“预测明天涨跌”。

它可以输出：

expected return；
probability of up move；
future mid-price move；
residual return；
volatility forecast；
spread convergence probability；
fill probability；
adverse selection probability；
impact estimate；
liquidity forecast；
tail probability。

Fair value 也是广义概念。

高频 maker 的 fair value 可能是：

FV = Mid + f(orderbook, trades, related\ instruments)

指数增强里的 fair value 是股票相对 benchmark 的预期 residual return。

期权里的 fair value 是未来分布、波动率曲面和 Greeks。

对冲里的 fair value 是 hedge ratio、basis、correlation 和 residual exposure。

所以 fair value 不是“资产真实价值”，而是当前交易决策所需的参考价值。

六、Edge：预测如何变成可交易收益

Edge 是连接预测和交易动作的桥。

单笔交易层面：

\text{gross edge} = E[\text{future value} \mid X_t, a] - \text{current executable price}

扣除成本后：

\text{net edge} = \text{gross edge} - \text{transaction cost} - \text{risk charge} - \text{capital charge}

只有当：

\text{net edge} > \text{threshold}

才值得交易。

这里的 threshold 不是装饰项。它要覆盖模型误差、估计噪声、执行不确定性和极端情况下的安全边际。

不同层级的 edge 不要混在一起：

trade-level edge：这笔交易扣成本后是否值得做；
portfolio-level edge：这组仓位在相关性、风险预算和约束下是否值得持有；
business-level edge：这套策略扣除基础设施、融资、容量和尾部风险后是否值得经营。

很多策略 paper alpha 很高，但真实交易后消失，是因为只证明了 forecast，没有证明 net edge。

七、Action Policy：策略本体是动作规则

策略必须定义 action space。

常见动作包括：

buy；
sell；
quote；
cancel；
hedge；
rebalance；
hold；
reduce；
stop；
do nothing。

真正的策略要决定：

做不做；
做多少；
用 taker 还是 maker；
用什么订单类型；
分几笔做；
什么价格做；
多久不成交就撤；
是否同时对冲；
是否超过风险预算；
是否进入 no-trade region；
什么时候认为逻辑坏了。

Action policy 比 signal 更接近策略本体。

一个 signal 可以对应很多策略：

小仓位慢慢买；
大仓位立刻买；
只在成本低时买；
等回撤后买；
配对后买；
用期权表达；
不交易，只降低已有仓位。

策略质量取决于 signal 如何被转化为动作，而不只是 signal 本身有多强。

八、Cost / Execution：成本是市场对策略的收费

交易成本不是回测最后扣一个常数。

它包括：

spread；
fee；
rebate；
slippage；
market impact；
delay cost；
borrow cost；
funding cost；
tax；
opportunity cost；
queue loss；
adverse selection cost。

Execution 要回答：

我想交易，和我真实成交，是不是同一件事？

高频里：

信号对了，但慢了 200 微秒，可能已经没钱赚；
挂单赚了 spread，但被 toxic flow 选择性成交，可能亏更多；
回测假设排队成交，但真实 queue position 根本轮不到。

中低频里：

年化 10% 的 paper alpha 可能被换手成本吃完；
小盘股因子可能有收益，但容量不足；
做空组合可能被 borrow cost 和 recall risk 破坏；
大资金调仓会把自己的 alpha 交易成 impact。

Execution 不是工程后处理，而是策略经济学的一部分。

九、Risk Inventory / Sizing：仓位决定策略寿命

Risk 不是附属模块，而是策略的一部分。

每个交易动作都会留下风险库存：

market beta；
sector exposure；
factor exposure；
inventory；
liquidity risk；
concentration；
leverage；
basis risk；
volatility exposure；
gamma / vega / theta；
borrow risk；
funding risk；
model risk；
data risk；
latency risk；
tail risk。

Sizing 不是把 signal 乘一个常数，而是把 edge、信心、波动、相关性、流动性、容量、回撤预算和尾部风险放在一起。

可以把仓位理解成：

\text{size} = f( \text{edge}, \text{confidence}, \text{volatility}, \text{liquidity}, \text{correlation}, \text{drawdown budget}, \text{tail risk}, \text{capacity} )

很多策略不是因为没有 alpha 死，而是因为：

仓位太大；
流动性不够；
相关性在危机时上升；
对冲失效；
成本模型低估；
保证金或融资条件变化；
极端行情没有 kill switch。

成熟策略必须知道：

什么情况是正常亏损，什么情况是策略逻辑坏了。

十、Validation：回测是在验证假设

回测的本质不是证明策略赚钱，而是回答：

这个策略在什么假设下赚钱？这些假设真实吗？

要验证：

数据是否 point-in-time；
是否有 lookahead bias；
是否有 survivorship bias；
label 是否和交易周期匹配；
成本模型是否真实；
fill model 是否真实；
latency 和 queue 是否真实；
liquidity constraint 是否真实；
capacity 是否真实；
regime split 下是否仍成立；
walk-forward 是否仍成立；
参数是否过拟合；
极端行情下是否可生存。

不同策略需要不同模拟精度。

高频需要：

order book replay；
queue simulation；
matching engine approximation；
latency simulation；
cancel delay；
fee / rebate；
exchange rules；
adverse selection model。

中低频需要：

point-in-time data；
corporate action adjustment；
rebalance simulation；
factor exposure；
borrow constraint；
cost and impact model；
liquidity and capacity constraint。

回测不是结论，而是假设审计工具。

十一、Attribution / Monitoring：上线后如何学习

没有 attribution，就不知道钱从哪里来，也不知道什么时候会失效。

Attribution 要回答：

收益来自 alpha、beta、factor、sector、timing、spread、rebate、inventory、hedge 还是成本节省？
亏损来自预测错误、执行退化、成本上升、风险暴露、流动性变化还是模型失效？
赚钱的来源是否和原始假设一致？
某个子模块坏了，还是市场机会本身消失了？

Monitoring 要跟踪：

PnL；
drawdown；
turnover；
fill rate；
slippage；
hit rate；
latency；
rejection；
cancel rate；
inventory；
exposure；
signal distribution；
feature drift；
alpha decay；
cost drift；
model confidence；
abnormal position；
stale data；
risk limit breach。

策略上线后，市场会变，数据会坏，交易通道会坏，成本会漂移，竞争会进入，模型会衰减。

所以 production 不是纯工程问题，而是策略生存问题。

十二、用统一框架看常见策略

策略形态	定价对象	主要 edge source	主要成本 / 风险	典型动作
高频 taker	极短期 mid-price move	order flow / 速度 / 短期信息	spread、fee、impact、latency、adverse move	主动吃单、快速退出、必要时对冲
高频 maker	fill 条件下的未来价值	liquidity provision、spread、rebate	adverse selection、inventory、queue loss	quote、cancel、skew、inventory control
指数增强	相对 benchmark 的 residual return	股票选择、约束优化、低换手	tracking error、turnover、factor drift	benchmark 约束下调仓
多头策略	风险调整后的资产收益	beta、风险溢价、选股 alpha	回撤、集中度、流动性、风格暴露	配置权重、控制风险预算
市场中性	对冲后的 residual alpha	横截面 mispricing、factor residual	borrow、short squeeze、hedge error	long / short、beta 或行业中性
统计套利	相对价格关系	均值回复、市场分割、临时错价	关系断裂、crowding、成本	pair / basket spread trading
CTA / 趋势	趋势延续和收益分布偏斜	trend persistence、convex payoff	whipsaw、vol regime、容量	volatility targeting、趋势跟随
期权 / 波动率	未来分布和波动率曲面	vol risk premium、convexity mispricing	Greeks、tail、liquidity、model risk	delta hedge、vega/gamma/theta exposure

这个表的作用不是分类百科，而是提醒：任何策略都可以被翻译成同一组问题。

十三、通用策略审查模板

分析任何交易策略时，先填这张表。

1. Market Game

交易什么？
规则是什么？
主要约束是什么？
容量在哪里受限？

2. Participants / Flows

谁在交易？
谁被迫交易？
我赚谁的钱？
为什么这个机会没有被消灭？

3. Information Set

用什么数据？
是否 point-in-time？
是否当时可获得？
时间戳是否准确？
数据坏了会怎样？

4. Priced Object

定价的是 future return、volatility、fill probability、basis、tracking error、impact，还是别的对象？
这个对象和最终 PnL 的关系是什么？

5. Forecast / Fair Value

预测什么 horizon？
label 怎么定义？
预测是否稳定？
衰减速度多快？
在不同 regime 下是否成立？

6. Edge Formula

gross edge 是什么？
transaction cost 怎么估？
risk charge 怎么估？
capital charge 怎么估？
no-trade threshold 是什么？

7. Action Policy

可采取哪些动作？
什么条件下交易？
做多少？
用什么订单类型？
什么时候撤、减仓、对冲或停止？

8. Cost / Execution

spread、fee、impact、slippage、latency、borrow、funding 如何进入模型？
paper trade 和真实成交差在哪里？
fill model 是否可信？

9. Risk Inventory / Sizing

留下了什么风险库存？
仓位如何决定？
最大亏损、最大回撤、最大敞口、最大流动性消耗是什么？
什么时候触发 kill switch？

10. Validation

回测验证了哪些假设？
哪些假设最脆弱？
是否能 survive costs、delay、lower fill rate、worse slippage、regime split、capacity constraint？

11. Attribution / Monitoring

钱来自哪里？
亏损来自哪里？
上线后看哪些指标？
什么情况说明策略坏了？

12. Iteration

下一步研究哪个模块？
是信息不够、定价不准、成本低估、执行差、仓位错，还是风险定义错？

Assumptions

本页把交易策略视为可重复执行的决策系统；纯主观交易也可以套用，但 action policy 和 validation 会更弱。
本页默认策略需要真实交易落地，因此把成本、执行、容量、风控和监控视为策略本体，而不是附属工程。
本页使用 broad quant language；不同市场的具体实现必须结合交易规则、数据可得性和执行基础设施重新定义。

Counterarguments

有些策略看起来不是预测，而是做市、套利或风险转移。回应是：它们仍然在预测条件分布，只是预测对象不是价格方向，而是 fill、adverse selection、spread capture、basis、volatility 或 risk compensation。
有些长期策略更像资产配置，不像交易系统。回应是：只要有仓位、成本、风险预算和再平衡规则，它仍然可以被写成 action policy。
统一框架可能牺牲策略细节。回应是：总框架只负责提出共同问题，具体策略应该拆成单独页面展开。

Update Triggers

当新增一个具体策略研究页时，检查它能否完整回答本页模板。
当某个策略类型的细节超过本页承载范围时，拆成独立页面并在本页保留入口。
当引入具体市场规则、成本参数、监管约束或实证结论时，补充 source trail。
当发现某类策略不能被这个框架自然解释时，更新框架本身。

Source Trail

本页当前是概念框架整理，不依赖特定市场数据、法规条文或实证结论。
后续加入具体市场规则、成本估计、策略论文或交易所制度时，需要补充对应 primary source 或研究来源。