kaggle——Bike Sharing Demand

个人感觉最主要是通过visualization来获取一些信息, 在这之前一般都要先提取出一些有用的feature,比如这里的时间字符串要先提取出“小时”这个信息 有时在丢到model之前需要extract一些feature,也需要drop一些没用的feature 比如24小时变化的曲线 工作日24h变话的曲线(想想也是对的,大部分是在上下班的时间) 周末24h变换的曲线 从中就可以挖掘出一些有用的
相关文章
相关标签/搜索