安达量化
登录

数据与指标

02 数据与指标:数据决定上限

量化的第一步是理解数据。我们以 ETF 日线数据为例(开盘/最高/最低/收盘/成交量/成交额),并结合复权因子进行还原。

数据来源与结构

  • 日线数据:开盘价、最高价、最低价、收盘价、成交量、成交额。
  • 复权因子:用于还原拆分、分红等影响,避免价格跳变。
  • 数据接口:ETF Sync API(本课程实验工具通过该接口获取数据)。

关键指标口径

  • 收益率:通常以收盘价计算日收益。
  • 年化收益:基于交易日折算,假设一年约 252 个交易日。
  • 最大回撤:净值相对历史峰值的最大跌幅。
  • 夏普比率:收益对波动的单位补偿,衡量风险调整后收益。

技术指标提示

  • 技术指标的分类与经典指标速览,集中在 第 04 章,便于统一理解与实验验证。

数据常见问题

  • 缺失值:跨市场或停牌会导致缺失,需要对齐与填充。
  • 幸存者偏差:仅使用“仍存活”的标的会高估策略表现。
  • 口径不一致:复权、非复权、数据源口径差异会改变结果。

风险提示

  • 数据质量决定策略上限;即使策略正确,错误数据也会导致错误结论。
  • 数据同步延迟可能导致信号滞后,实盘与回测表现偏离。