数据与指标
02 数据与指标:数据决定上限
量化的第一步是理解数据。我们以 ETF 日线数据为例(开盘/最高/最低/收盘/成交量/成交额),并结合复权因子进行还原。
数据来源与结构
- 日线数据:开盘价、最高价、最低价、收盘价、成交量、成交额。
- 复权因子:用于还原拆分、分红等影响,避免价格跳变。
- 数据接口:ETF Sync API(本课程实验工具通过该接口获取数据)。
关键指标口径
- 收益率:通常以收盘价计算日收益。
- 年化收益:基于交易日折算,假设一年约 252 个交易日。
- 最大回撤:净值相对历史峰值的最大跌幅。
- 夏普比率:收益对波动的单位补偿,衡量风险调整后收益。
技术指标提示
- 技术指标的分类与经典指标速览,集中在 第 04 章,便于统一理解与实验验证。
数据常见问题
- 缺失值:跨市场或停牌会导致缺失,需要对齐与填充。
- 幸存者偏差:仅使用“仍存活”的标的会高估策略表现。
- 口径不一致:复权、非复权、数据源口径差异会改变结果。
风险提示
- 数据质量决定策略上限;即使策略正确,错误数据也会导致错误结论。
- 数据同步延迟可能导致信号滞后,实盘与回测表现偏离。