时间序列(一)

时间序列(time series)数据是一种重要的结构化数据形式,应用于多个领域,包 括金融学、经济学、生态学、神经科学、物理学等。在多个时间点观察或测量到的 任何事物都可以形成一段时间序列。

pandas提供了许多内置的时间序列处理工具和数据算法。可以高效处理非常大的时间序列,轻松地进行切片/切块、聚合、对定期/不定期的时间序列进行重采样等。有些工具特别适合金融和经济应用,你当然也可以用它们来分析服务器日志数据。

日期和时间数据类型及工具

Python标准库包含用于日期(date)和时间(time)数据的数据类型,而且还有日历方面的功能。我们主要会用到datetime、time以及calendar模块。
在这里插入图片描述

=====================================
datetime以毫秒形式存储日期和时间。timedelta表示两个datetime对象之间的时间差。在这里插入图片描述

=====================================
可以给datetime对象加上(或减去)一个或多个timedelta,这样会产生一个新对 象。
在这里插入图片描述
在这里插入图片描述

字符串和datetime的相互转换

利用str或strftime方法(传入一个格式化字符串),datetime对象和pandas的 Timestamp对象可以被格式化为字符串。
在这里插入图片描述
在这里插入图片描述

=====================================
datetime.strptime可以用这些格式化编码将字符串转换为日期在这里插入图片描述

=====================================
dateutil这个第三方包中的parser.parse方法通过已知格式进行日期解析的最佳方式。
在这里插入图片描述

=====================================
dateutil可以解析几乎所有人类能够理解的日期表示形式
在这里插入图片描述

=====================================
在国际通用的格式中,日出现在月的前面很普遍,传入dayfirst=True即可解决这个问题
在这里插入图片描述

=====================================
pandas通常是用于处理成组日期的,不管这些日期是DataFrame的轴索引还是列。 to_datetime方法可以解析多种不同的日期表示形式。
在这里插入图片描述

=====================================
它还可以处理缺失值
在这里插入图片描述

=====================================
NaT(Not a Time)是pandas中时间戳数据的null值。

dateutil.parser是一个实用但不完美的工具。比如说,它会把一些原本不 是日期的字符串认作是日期(比如"42"会被解析为2042年的今天)
在这里插入图片描述

++++++++++++++++++++++++++++++++++++

下一篇:时间序列(二)