Data Layer
在数据层,我们对数据进行提取,清理,并且挖掘数据当中的一些特征
Data Cleaning
提取得到的原始数据往往在一定程度上,都会存在错误、NaN
对于NaN的处理,在高频和低频数据上,处理手段往往不同:
- 在低频数据上,除了流动性特别低的股票,大多数股票数据出现NaN,通常意味着交易在这段时间内暂停了
- 可以选择直接删除存在NaN的行,表示这个时间段交易暂停
- 在高频数据上,NaN到处都是,代表这段小时间就单纯没有交易发生
- 可以采用自动填充的方法,把存在NaN的行,通过某种合理的方式补齐,比如对于存在NaN的行,我们让open,high,low,close这几列直接等于上一个有效的open,high,low,close,让volume为0
Feature Engineering
- MACD:移动平均
- RSI
- ADX
- CCI