使用kubesql进行kubernetes资源查询

时间 2019-12-07

标签使用 kubesql 进行 kubernetes 资源查询繁體版

原文原文链接

kubesql

kubesql(https://github.com/xuxinkun/kubesql)是我最近开发的一个使用sql查询kubernetes资源的工具。诸如node，pod等kubernetes的资源被处理为table。然后可使用sql语句对其进行查询。node

例如，全部pod都很容易从apiserver中获取。可是想要计算每一个节点上的pod数量并不容易。可是使用了kubesql，只用一条sql语句能够实现它。git

[root@localhost kubesql]# kubesql "select hostIp, count(*) from pods group by hostIp"
+----------+----------------+
| count(*) | hostIP         |
+----------+----------------+
| 9        | None           |
| 4        | 22.2.22.222    |
| 14       | 11.1.111.11    |
+----------+----------------+

相似的，若是我要查询有多少处于Pending状态的容器，也可使用这样的语句。github

[root@localhost kubesql]# kubesql "select count(*) from pods where phase = 'Pending'"
+----------+
| count(*) |
+----------+
| 29       |
+----------+

kubesql的思路其实就是将一个pod内描述的各个属性转化为数据库中的一行数据。sql

apiVersion: v1
kind: Pod
metadata:
  creationTimestamp: 2018-09-28T07:42:35Z
  name: watchtest
  namespace: wangsiwu
  uid: 10b60b8e-c2f2-11e8-8cfe-e0db55138e34
spec:
  nodeName: 10.8.64.179
  schedulerName: default-scheduler
status:
  phase: Pending

[root@f34cee76e36a kubesql]# kubesql "select * from pods where name='watchtest'"
+-------------+-------------------+-------------------+-----------+-----------+--------+-------+-----------+--------+---------+---------------------------+--------------------------------------+
| nodeName    | schedulerName     | deletionTimestamp | namespace | name      | reason | podIP | startTime | hostIP | phase   | creationTimestamp         | uid                                  |
+-------------+-------------------+-------------------+-----------+-----------+--------+-------+-----------+--------+---------+---------------------------+--------------------------------------+
| 10.8.64.179 | default-scheduler | None              | wangsiwu  | watchtest | None   | None  | None      | None   | Pending | 2018-09-28 07:42:35+00:00 | 10b60b8e-c2f2-11e8-8cfe-e0db55138e34 |
+-------------+-------------------+-------------------+-----------+-----------+--------+-------+-----------+--------+---------+---------------------------+--------------------------------------+

工做原理

kubesql主要由三个组件组成。docker

kubesql-watch：始终watch来自kube-apiserver的事件，并将其进行整理为table，而后写入sqlite3。
kubesql-server：提供http api进行查询。接受sql查询，在sqlite3中执行查询并返回查询结果。
kubesql-client：将查询sql发送到kubesql-server并获取结果，而后以表格格式打印结果。

为了增长sqlite3的吞吐量，db文件放在共享内存中，例如放在/dev/shm文件夹。请确保shm超过64MB（若是集群很是大，这里应该对应设置的较大）。数据库

+----------------+  watch   +---------------+     +---------+
| kube-apiserver | -------> | kubesql-watch | --> | sqlite3 |
+----------------+          +---------------+     +---------+
                                                    ^
                                                    |
                                                    |
+----------------+  http    +---------------+       |
| kubesql-client | -------> | kubsql-server | ------+
+----------------+          +---------------+

部署方式

使用docker能够进行方便的部署（我正在编写使用kubernetes进行部署，很快会更新上去）。api

这里假定将kubeconfig放置在物理机的/etc/kubernetes/kubeconfig位置上。bash

首先部署kubesql-watch和kubesql-server。网络

docker pull xuxinkun/kubesql
docker run -it -d --name kubesql-watch -v /dev/shm:/dev/shm -v /etc/kubernetes/kubeconfig:/etc/kubeconfig xuxinkun/kubesql kubesql-watch
docker run -it -d --name kubesql-server -v /dev/shm:/dev/shm -v /etc/kubernetes/kubeconfig:/etc/kubeconfig xuxinkun/kubesql kubesql-server

使用方式

执行kubesql命令，使用sql进行相关的查询。建立一个kubesql的容器用以执行命令。架构

这里特别注意，若是不修改配置，就要使用--net=container:kubesql-server将kubesql的容器和kubesql-server的容器网络在一块儿，这样能够经过127.0.0.1地址进行访问。这个地址能够在/etc/kubesql/config中进行配置。若是配置了这个地址，就没必要使用这个--net的参数了。

[root@localhost kubesql]# docker run -it --rm --name kubesql --net=container:kubesql-server xuxinkun/kubesql bash
[root@d58bbb8c7aa8 kubesql]# kubesql -h
usage: kubesql [-h] [-t TABLE] [-a] [sql]

positional arguments:
  sql                   execte the sql.

optional arguments:
  -h, --help            show this help message and exit
  -t TABLE, --table TABLE
                        increase output verbosity
  -a, --all             show all tables

kubesql -a 命令能够查看当前支持的表格。

[root@localhost kubesql]# kubesql -a
+------------+
| table_name |
+------------+
| pods       |
| nodes      |
+------------+

kubesql -t {table_name} 能够查询 table_name 表格支持的字段。每一个字段对应的是api中的哪一个字段，能够在/etc/kubesql/params中查看。

[root@localhost kubesql]# kubesql -t nodes
+-------------------------+-----+------------+---------+----+-----------+
| name                    | cid | dflt_value | notnull | pk | type      |
+-------------------------+-----+------------+---------+----+-----------+
| name                    | 0   | None       | 0       | 0  | char(200) |
| uid                     | 1   | None       | 0       | 0  | char(200) |
| creationTimestamp       | 2   | None       | 0       | 0  | datetime  |
| deletionTimestamp       | 3   | None       | 0       | 0  | datetime  |
| allocatable_cpu         | 5   | None       | 0       | 0  | char(200) |
| allocatable_memory      | 6   | None       | 0       | 0  | char(200) |
| allocatable_pods        | 7   | None       | 0       | 0  | char(200) |
| capacity_cpu            | 8   | None       | 0       | 0  | char(200) |
| capacity_memory         | 9   | None       | 0       | 0  | char(200) |
| capacity_pods           | 10  | None       | 0       | 0  | char(200) |
| architecture            | 11  | None       | 0       | 0  | char(200) |
| containerRuntimeVersion | 12  | None       | 0       | 0  | char(200) |
| kubeProxyVersion        | 13  | None       | 0       | 0  | char(200) |
| kubeletVersion          | 14  | None       | 0       | 0  | char(200) |
| operatingSystem         | 15  | None       | 0       | 0  | char(200) |
| osImage                 | 16  | None       | 0       | 0  | char(200) |
+-------------------------+-----+------------+---------+----+-----------+

一些样例

查询某个节点的pod的名称和ns。

[root@localhost kubesql]# kubesql "select name, namespace from pods where hostIp = '172.22.160.107'"
+-----------+-----------------------------------------------------------+
| namespace | name                                                      |
+-----------+-----------------------------------------------------------+
| default   | imagetest1                                                |
| xutest    | dftest-b16f1ac7-0b56c2b9-v2bw2                            |
| default   | imagetest                                                 |
| xutest    | dftest-9da529db                                           |
+-----------+-----------------------------------------------------------+

查询2019-03-12以后建立的容器名称和建立时间。

[root@localhost kubesql]# kubesql "select name, namespace,creationTimestamp from pods where creationTimestamp > datetime('2019-03-12') order by creationTimestamp desc"
+-----------+---------------------------+------------------+
| namespace | creationTimestamp         | name             |
+-----------+---------------------------+------------------+
| huck-test | 2019-03-12 07:59:36+00:00 | xxxxlog-v4-hvmsd |
| xutt      | 2019-03-12 02:45:40+00:00 | soxcs-a03b8302   |
+-----------+---------------------------+------------------+

查询docker版本是1.10.3的节点。

[root@localhost kubesql]# kubesql "select name,containerRuntimeVersion from nodes where containerRuntimeVersion = 'docker://1.10.3'"
+----------------+-------------------------+
| name           | containerRuntimeVersion |
+----------------+-------------------------+
| 111.22.111.31  | docker://1.10.3         |
| 11.3.22.201    | docker://1.10.3         |
+----------------+-------------------------+

开发的思路历程

多年前，接触了facebook开源的项目osquery。关于该项目能够参见我之前的博客资料https://xuxinkun.github.io/tags/#osquery。

osquery使用sql来管理系统信息，进行查询的思路给了我极深的印象。在我后来使用kubernetes时，我也常常会想，能不能用sql来查询kubernetes的资源。

在这个思路的启发下，我作了初版的kubesql，其主要是将kube-apiserver的数据写成文件，然后由spark进行读取，并执行查询。这个版本的kubesql有很大的一个问题，就是数据不可以动态更新。并且不太稳定，常常出现spark退出的问题。另一个弊病是字段难于重命名，好比metadata.name字段就只能使用这个很长的名字，不方便使用。

所以我在从新开发的时候，从新设计了实现方式和架构，更具备灵活性。并且支持字段重命名。固然，也有不少不完善的地方。还须要开发的。

若是有兴趣的同窗，也能够一块儿来参加开发。个人开发计划以下：

增长list的支持，能够支持pod中container字段的支持
完善出错处理
提升watch性能，减小对sqlite3的压力
增长自定义处理函数，这样能够将内存等值从字符串处理为数值
增长更多的资源支持，如rs，configmap，deployment等