← 返回文章列表

量化随笔 27:数据清洗的边界

量化随笔 · 2026-05-31 19:27:16
过度清洗会把真实的极端信息当作异常剔除。 放任不管则会让噪音主导模型学习。 关键在于区分技术错误与真实事件。 量化数据工程的难点,在于设定合理的清洗边界。

推荐文章

策略的生态位:在市场中找到自己的位置
策略之间存在生态关系,理解自己的生态位有助于避免拥挤交易。
量化随笔 31:信号叠加的干扰
多个信号叠加时,彼此之间会产生干扰。
量化随笔 89:技术债务的隐形风险
技术债务最终会转化为风险事件。
量化随笔 96:团队记忆的结构化
团队的经验需要被结构化存储。
纯仓位驱动(Position‑Driven)量化策略
不看价格、不看技术、不看盘口、不看成交,只用自己的仓位规则来决定下单位置
风险管理:系统的第二条生命线
风险管理不是附属品,而是策略的核心。本文讨论量化风险的三个层次。
策略研究:从直觉到结构化假设
策略研究不是从数据开始,而是从假设开始。本文讨论策略研究的正确流程。
量化随笔 81:模型版本控制
模型也需要版本控制。
数据分辨率:越高越好吗
高分辨率数据并不总是带来更好的策略。
量化随笔 59:资金曲线的噪音过滤
资金曲线本身也需要被当作时间序列分析。