我叫顾知行,日常工作是给量化团队做策略评审和交易链路验收。很多人问“量化交易是怎么操作的”,其实它不是一句“用程序自动买卖”就能概括的事,而是一条从想法验证、数据处理、回测评估、风控约束到真实下单的流水线。你把它理解成“可复用的交易生产线”更贴切:每一步都要能解释、能复现、能被风控拦得住,才能上线。

我会按我在团队里最常用的视角,把量化从0到1的操作拆开讲:你需要准备什么、每一步在干什么、常见坑在哪里、最后如何落到“能活着运行”的交易系统。

我们在写的不是“预测”,而是可执行的规则

量化策略最核心的产物不是观点,而是一组能在任何时刻给出一致动作的规则:什么时候买、买多少、什么时候卖、遇到极端行情怎么退场。把“感觉会涨”翻译成规则,是第一道门槛。

我常见的策略来源大致三类:

  • 统计规律型:例如均值回归、动量、期限结构、价差、波动率结构。它们不要求你解释“为什么”,但要求你能证明在历史上“经常如此”,并且在交易成本之后仍有空间。
  • 事件/信息型:财报、公告、宏观数据发布、期权到期、再平衡等。更像“条件触发器”,但对数据时间戳要求极严。
  • 微观结构型:盘口、成交簿、撮合节奏、冲击成本。更偏高频或日内,对基础设施与费用敏感。

在把想法落成规则时,我会逼自己写清三件事:

量化交易是怎么操作的-从策略到下单的全流程拆解

1)信号怎么来:用什么数据算出“买/卖/空仓”的信号;2)仓位怎么定:固定手数、波动率目标、风险预算、Kelly变体等;3)退出怎么做:止损/止盈/时间止损/信号反转/风控熔断。

这也是为什么很多“看起来很灵”的想法,上线后不灵:因为它只停留在观点,没有变成在任何情况下都能执行的“机器可读规则”。

数据到回测:最容易被忽略的,是时间和成本

量化团队里最贵的不是GPU,是“脏数据导致的虚假收益”。我做评审时会优先检查两件事:时间对齐与交易成本。

时间对齐:避免“偷看未来”很多策略回测收益漂亮,问题出在拿到了当时不可能拿到的数据。典型例子:

  • 用收盘价生成信号,却假设能以收盘价成交;更合理的是用下一根K线开盘、或设置滑点后成交。
  • 财务数据、指数成分、公告的“披露时间”被忽略,回测直接用“生效日”的数据,相当于提前知道。
  • 用分钟级信号却用日线成交价结算,频率不匹配。

我的经验是:回测系统必须有可追溯的时间戳字段(数据产生时间、披露时间、可交易时间),没有就不要相信收益曲线。

成本模型:把“能赚”变成“能落地”量化交易是怎么操作的,落地时一定要把费用拆成三类:

  • 显性费用:佣金、交易所/平台费、税费(视市场而定)。
  • 隐性成本:买卖价差、滑点、冲击成本(下单越大越明显)。
  • 约束成本:涨跌停、停牌、可融券量、最小下单单位、撮合规则。

如果你做的是A股或流动性一般的标的,冲击成本可能直接把“纸面alpha”吃光;做数字资产或外汇,价差和手续费结构又会很不同。成本不建模,回测只是“数学游戏”。

回测要看什么:不只看收益率我在评审里不会只问“年化多少”。更重要的是:

  • 回撤与回撤修复时间:你能不能承受它。
  • 收益来源稳定性:是不是集中来自少数几天/几只标的。
  • 换手与容量:资金变大后还能不能做。
  • 鲁棒性:参数稍微变动、样本切分后是否还站得住。

至于统计显著性、过拟合检测、样本外验证这些话题,可以很复杂,但最朴素的一句是:同一个想法,换市场、换时间、换成本假设后是否仍合理。

上线那一刻:风控、执行、监控才是真正的交易系统

回测通过不代表能实盘。实盘系统至少要包含三块:风控层、执行层、监控层。很多个人量化卡在“能出信号、不会下单”,或者“能下单、遇到极端就爆”。

风控层:把策略关进笼子里我会把风控分成策略内与策略外两类。

  • 策略内风控:止损/止盈、波动率目标、最大持仓、单标的集中度、信号失效后的降仓。
  • 策略外风控:账户级最大回撤、单日最大亏损、杠杆上限、保证金预警、黑名单(重大事件、停牌、流动性骤降)。

很多机构会做“硬风控”:触发阈值就强制减仓或平仓;也会做“软风控”:触发后只能下更小的单、或只允许平仓不允许开仓。个人做量化也建议至少有账户级的硬阈值,否则一次极端波动就把长期优势抹掉。

执行层:信号到成交,中间隔着一条“现实”信号发出后,真正的问题是:用什么方式成交、成交多少、成交得多快。

常见执行方式从简单到复杂大致是:

  • 市价/限价直接下单:适合低频、流动性好且不追求精细成本控制的策略。
  • 拆单执行:把大单拆成多笔,减少冲击。
  • 算法执行:例如按成交量比例、时间均匀等方式下单(具体是否可用取决于券商/交易接口能力)。

执行层还要处理一堆“脏活”:部分成交怎么补、撤单频率限制、价格笼子、盘口跳价、断线重连、订单状态不一致等。量化实盘里最常见的亏损,不是模型错,而是执行与风控没兜住。

监控层:你需要“报警”,而不是“祈祷”上线后我会要求至少有三类监控:

  • 交易监控:订单失败率、滑点异常、撤单异常、成交偏离。
  • 策略监控:信号频率突变、因子分布漂移、相关性突然升高。
  • 系统监控:延迟、断线、数据缺失、时钟漂移。

监控的目的不是让你盯盘,而是当系统偏离预期时能及时停机或降级。

新手最常踩的坑:把“量化”当成稳赚工具

我见过太多把量化当“自动提款机”的预期,最后输在三个误区上:

  • 误区一:只要回测好看就能实盘回测是筛选,不是证明。尤其当你用到了高自由度模型、频繁调参、样本期过短时,过拟合概率会明显上升。

  • 误区二:忽略容量与流动性小资金能跑的策略,资金变大后会被冲击成本吞噬;小币种、小盘股更明显。

  • 误区三:风控靠“我会盯着”人盯盘无法覆盖断网、接口故障、极端行情连续跳空等场景。量化的本质是流程化,风控也必须流程化。

如果你在选择券商、交易接口或数据源时想对照权威口径,建议直接看交易所/监管或官方文档的描述与接口规范。比如A股交易规则与公告可在上海证券交易所网站(https://wvw.sse.com.cn)与深圳证券交易所网站(https://wvw.szse.cn)查询;国内证券期货监管信息可在中国证监会官网(http://wvw.csrc.gov.cn)查看。不同市场规则差异很大,别用“别的市场能这么干”去套。

我写到这里,你应该能更具体地理解“量化交易是怎么操作的”:它不是一段策略代码,而是“规则 + 数据 + 回测评估 + 风控约束 + 执行系统 + 监控告警”的组合。你如果愿意再往前走一步,最实用的起点通常不是追求高深模型,而是选一个你能拿到可靠数据、能清楚建模成本、能严格做风控的简单策略,把这条链路跑通。跑通一次,你再谈更复杂的因子和模型,成功概率会高很多。