全部时序数据就是基于时间而产生的一系列数据,在有时间坐标的坐标体系中,按照时间将这些数据点连成线,能够揭示其趋势与规律,若是对这些时序数据加以分析处理,能够用以训练机器学习模型,从而实现对将来的预测与预警。html
了解了时序数据,时序数据库也就不难理解,就是用来存放时序数据的数据库。由于时序数据具备实时性与体量大的特色,全部时序数据库也就必须具有写入快的特性,同时为了方便查询,也就必须具有持久化与多维度聚合查询的特性。数据库
数据点(point)
度量(measurement)
时间戳(timestamp)
度量字段(field)
标签(tag)
在 Mac 系统中安装 influxDB 仍是比较简单的api
brew
来进行安装brew install influxdb
复制代码
ln -sfv /usr/local/opt/influxdb/*.plist ~/Library/LaunchAgents
复制代码
更多关于
launchd
能够查看 Mac OSX的开机启动配置bash
咱们能够经过 launchctl
来使用上面异步添加的定时任务来启动机器学习
launchctl load load ~/Library/LaunchAgents/homebrew.mxcl.influxdb.plist
复制代码
更多关于
lanuchctl
能够查看 Mac中的定时任务利器:launchctl异步
也能够直接读取安装好的配置文件来启动学习
influxd -config /usr/local/etc/influxdb.conf
复制代码
启动后,influxdb 会监听两个端口:ui
8086 用来提供 client/server 的交互(经过 http api)spa
8088 用来提供备份和还原的 RPC 服务使用unix
启动好 influxdb
后,咱们就能够在终端经过 influx
命令来与数据库来进行交互了 (默认链接到 8086 端口)
到目前为止没有尚未对 influxDB 有更深刻的了解,什么 measurement
, 什么 point
, 可是就算如此,咱们也能够先玩起来,看看 influxdb 究竟是何物?
influx -precision rfc3339
复制代码
-precision
用来自定 timestamp 的格式标准rfc3339
(YYYY-MM-DDTHH:MM:SS.nnnnnnnnnZ)
其实如今咱们就能够按照 influxQL
语法,输入查询语句与 influx 数据存储服务进行交互了。
CREATE DATABASE logdb
复制代码
这里咱们将建立一个名叫
logdb
的数据库, 须要注意的是在 cli 中操做成功后并不会有什么反馈,可是失败了确定会有提示,用官方的描述来形容就是没有消息就是好消息
。
SHOW DATABASES
复制代码
结果以下图
其中
logdb
就是咱们建立的数据库,_internal
则是 influxDB 内部使用的数据库。
influxDB 执行的每条语句都必须指定一个固定的数据库做为其执行的上下文,因此咱们要不就是在编写每条语句的时候都显示的选择一个数据库,要不就先选择一个数据库后续的语句都默认在这个数据库上执行操做。
USE logdb
复制代码
执行结果以下:
打脸老是来的那么快,上面还说任何操做成功后都没有反馈 ~~ 也许 USE 指令是一个特例吧 ~~
从前面的概念介绍咱们能够了解到,influxdb 是经过时间序列(time series)
来组织存储数据的。那这个时间序列到底长什么样呢?
Time series
其实就是一个概念,是存储在 influxdb 中全部数据集合的概念,能够包含 0 ~ ∞ 条数据,在 influxDB 中一条数据又叫一条 point
。
一条 point 表明了一个度量维度的一组散列样本 measurement
, 因此 point = measurement + time
一个 measurement
由至少一个 key-value 对的 field
和 0 ~ ∞ 个 tag
组成。
field
表示都是 measurement
的一个具体的值。
tag
表示的是 measurement
的元数据,具体在查询的时候的过滤条件。
因此 point 的组成语法以下
<measurement>[,<tag-key>=<tag-value>...] <field-key>=<field-value>[,<field2-key>=<field2-value>...] [unix-nano-timestamp]
复制代码
举个例子🌰
接下来就是开始实践 ~
INSERT cpu,host=serviceA,region=us_west value=0.64
复制代码
结果以下:
注意空格在 influxql 中是具备特殊意义的,因此,在书写时
,
逗号后面是不能够再包含空格的,上图第一次执行插入的时候cpu,
后面有一个空格,因此插入失败。
从上面的执行语句咱们能够看到,咱们在执行的时候并无添加任什么时候间戳,知识后数据库是会为咱们自动插入运行数据库的系统的本地时间戳的。
SELECT "host", "region", "value" from cpu
复制代码
执行结果以下:
OK! 大功告成 ~ 接下来咱们就能够开始学习 influxQL 的语法,进行更多高级操做了 ~