Cassandra监控 - OpsCenter手册

注:本文转自:http://eric100.blog.51cto.com/2535573/1717792html

Opscenter用户手册node

1.       OpsCenter简介

DataStaxOpsCenter是一个可视化管理和监控Apache Cassandra和DataStax Enterprise工具。OpsCenter简化了管理任务:python

  • 添加扩展集群web

  • 配置nodesjson

  • 查看性能指标api

  • 修复问题浏览器

  • 监控集群状况安全

  • 主要功能

OpsCenter主要功能以下:网络

Dashboard 架构

概述显示任何警报和多个集群的仪表板。

仪表板显示性能指标监测的概况。

能够在仪表板中添加和编辑图表。

配置管理

基本的集群配置。

管理任务,好比使用简单的单击操做添加集群。

可视化的集群配置。

使用agent管理多个集群。

多个node管理。

下载PDF的集群报告。

only企业版的功能

仅支持DataStax Enterprise版本。

监控DSE内存tables的功能。

查看spark console。

主备切换,自动失效转移。

安全,能够定义用户角色。

DSE管理服务:

  • Backup服务 – 容许自动或手动备份。

  • Repaire服务 – 执行修复操做在DSE集群。

  • Capacity服务 – 监控集群性能,预测性能趋势。

  • Best Practice服务 – 执行预约义的best practice规则,校验集群环境的变量属性。

  • 性能服务 – 监控能行指标,并经过提示建议快速修复问题

告警:

  • 内置通知功能。

  • warning告警

  • 从Cassandra,Analytics和Search nodes收集指标,并存储在OpsCenter建立的keyspace中。

批量管理多个节点。

当新node添加或删除时,Rebalance数据。

生成诊断的tarball,支持问题的排除。

Hadoop Job  Tracker集成。

查看过去一周的历史指标。

1.2.    OpsCenter架构概览

经过Cassandra和DataStaxEnterprise安装DataStax agents。Agents使用Java Management Extensions (JMX)来监控管理每一个node。

wKioL1ZZV9ihlrfoAACM3KKXmuI609.png

2.       安装OpsCenter

2.1.    准备

最小的硬件环境:

  • 2 CPU cores

  • 2 GB of RAM available to OpsCenter

权限和软件环境:

  • 若是但愿对配置的values加密,需安装pycryptolibrary

  • 安装JRE或JDK。

  • 建议使用最新版本的浏览器。OpsCenter不支持InternetExplorer和 Microsoft Edge。

  • Python 2.6+

 

2.2.   安装步骤

一、下载OpsCenter

$ curl -Lhttp://downloads.datastax.com/community/opscenter.tar.gz | tar xz

文件已包含DataStaxagent。

二、进入opscenterversion_number目录

$ cd opscenter-version_number

三、启动OpsCenter

$ bin/opscenter

注意:使用bin/opscenter –f是在前台启动

四、浏览器打开OpsCenter

http://opscenter-host:8888/

3.       安装DataStax agents

经过OpsCenter添加完集群以后,会在Dashboard上显示agents状态。

OpsCenter会尝试自动安装agents,若是失败须要在每一个节点上手动安装。

3.1.    前置条件

  • Root或sudo安装agents。

  • JMX链接可用在集群节点上。

  • SSH可用。

  •   OpsCenter诊断tarball特性须要GNU1.16版本以上。CentOS/RHEL须要6以上。

3.2.    步骤

一、打开浏览器,访问http://opscenter_host:8888

http://1.2.3.4:8888/

当首次开启OpsCenter,会提示你链接集群:

wKioL1ZZWNHh2YGFAAAv3Tlonww527.png

二、点击ManageExisting Cluster,出现Add Cluster对话框。

wKiom1ZZWJigiLMHAABvwFIhh3Q247.png

三、在Add Cluster,输入集群节点的Hostnames或IP地址,设置JMX和Native Transport端口号,点击Save Cluster

OpsCenter链接到集群后,在Dashboard顶部会出现Fix链接。

四、点击Fix链接开始安装agents

wKioL1ZZWVfQWCHuAAAMp2G-dWA236.png

五、在Install Node Agent,点击EnterCredentials

六、在Node SSH Credentials,输入username和其余验证信息,点击Done。

七、在Install Node Agent对话框,点击Install on all nodes。

八、若是提示,点击Accept Fingerprint添加节点主机。

3.3.    结果

DataStax agents已经被安装部署到集群节点上。

若是你不可以经过OpsCenter UI安装agents,请参考手动部署agents。

3.4.    手动部署agents

3.4.1.       前置条件

  • Cassandra或DataStax Enterprise集群正在运行。

  • OpsCenter已经安装。

  • 集群节点JMX可用。

  • OpsCenter诊断tarball特性须要GNU1.16版本以上。CentOS/RHEL须要6以上。

  • SYSSTAT工具(用来手机I/O指标,yuminstall –y sysstat)

3.4.2.       步骤

  1. 下载DataStax agent tarball

$ curl -Lhttp://downloads.datastax.com/community/datastax-agent-version_number.tar.gz| tar xz

  1. 切入到agent目录

$ cd datastax-agent-version_number

  1. address.yaml中设置stomp_interface为OpsCenter的IP地址(须要手动建立此文件)

$ echo "stomp_interface:reachable_opscenterd_ip" >> ./conf/address.yaml

  1. 若是在opscenterd.conf中开启了SSL,则在address.yaml添加SSL。

$ echo "use_ssl: 1" >>./conf/address.yaml

  1. 开启agent

$ bin/datastax-agent

使用-f选项能够运行在前台

3.5.    OpsCenter 参考

3.5.1.       OpsCenter 和DataStax agent端口号

端口号

描述

OpsCenter端口号

8888

OpsCenter web地址端口。Opscenterd监听来自浏览器的HTTP端口号,在opscenterd.conf中配置。

50031

OpsCenter对于Job Tracker的HTTP代理端口。Opscenterd进程监听浏览器查看Hadoop Job Tracker页面的HTTP端口号,在opscenterd.conf中配置(只支持DataStax  Enterprise)

61620

OpsCenter监控端口号。Opscenterd进程监听来自agent的TCP交互。在opscenterd.conf中配置。

DataStax agent端口号

7199

JMX监控端口号。每一个agent节点会打开一个JMX链接

8012

Hadoop Job Tracker client端口号(只支持DataStax Enterprise)

8012

Hadoop Job Tracker website端口号(只支持DataStax  Enterprise)

8012

Hadoop Task Tracker website端口号(只支持DataStax Enterprise)

9042

native transport端口号,在cassandra.yaml中配置的native_transport_port

61621

DataStax agent端口号

22

SSH端口号。在opscenterd.conf中配置。

Solr和Demo applications端口号

8983

Solr端口号和Demo  applications端口号

LDAP服务端口号

389

非SSL LDAP和AD默认端口号。在opscenterd.conf中配置。

636

SSL LDAP和AD默认端口号。在opscenterd.conf中配置。

3.5.2.       安装配置路径

3.5.2.1.   非服务tarball安装默认文件路径

文件路径与tarball安装路径相同。

安装文件列表以下:

Directory

Location

/agent

Agent安装文件

/bin

启动和配置二进制命令

/content

Web应用文件

/conf

配置文件

/doc

License文件

/lib and /src

Library文件

/log

OpsCenter日志文件

/ssl

agent交互的SSL文件

3.5.3.       启动,中止和重启OpsCenter

非服务tarball步骤:

一、启动opscenterd:

$ install_location/bin/opscenter ##使用-f可前台启动

二、中止和重启opscenterd:

  •  找出opscenterd进程ID(pid),kill掉进程

$ ps -ef | grep opscenter

$ sudo kill pid

  • 启动opscenterd:

$ install_location/bin/opscenter ##使用-f可前台启动

3.5.4.       启动和重启DataStax agents

非服务tarball安装方式步骤:

一、启动agent:

$ install_location/bin/datastax-agent##使用-f可前台启动

二、中止和重启agent:

  •  找出agent进程ID(pid),kill掉进程

$ ps -ef | grep datastax-agent

$ sudo kill pid

  • 启动opscenterd:

$ install_location/bin/ datastax-agent ##使用-f可前台启动

4.       配置

4.1.    配置事件告警

Activities展现了OpsCenterEvent日志页面,包含事件和告警列表。下面的列表展现了事件日志级别:

  • DEBUG (0)

  • INFO (1)

  • WARN (2)

  • ERROR (3)

  • CRITICAL (4)

  • ALERT (5)

告警:

可选的,你能够配置OpsCenter发送告警信息对于选中的日志级别。这些告警能够经过邮箱、HTTP提供。默认告警不可用。

告警能够经过OpsCenter API或UI事件促发。好比,nodetool经过命令行执行move操做将不会促发告警,可是经过OpsCenter Nodes > List View > Other Actions > Move将会促发告警

告警包含的信息:

Field

Description

Example

api_source_ip

发送请求的原IP地址

67.169.50.240

target_node

STREAMING操做的目的地址

10.1.1.11

event_source

事件产生的组件

OpsCenter (i.e., restart, start)

user

事件产生的OpsCenter user

opscenter_user

time

事件时间

1311025650414527

action

事件类型

20

subject

邮件告警主题

[WARN] OpsCenter Event - Node reported as  being down: 127.0.0.1

message

事件描述

Garbage Collecting node 10.1.1.13

level

日志级别的数值

1

source_node

事件发生的原节点

10.1.1.13

level_str

事件日志级别

INFO

4.1.1.       开启邮箱告警

为了启动邮箱告警,须要编辑<config_location>/event-plugins/email.conf文件并提供可用的SMTPserver host和port信息。

4.1.1.1.   前置条件

确保你拥有可用的SMTP账号能够收发告警。

4.1.1.2.   步骤

  1. 在OpsCenter主机上打开email.conf文件

  2. 设置enabled为1

  3. 提供有效的SMTP的主机、端口号、用户名和密码

  4. 提供有效的邮箱地址,to_addr和from_addr。to_addr值为接受告警账号

  5.  可选的:设置发送告警级别。默认为监听全部基本

  6. 可选的:自定义发送主题

  7. 保存<config_location>/event-plugins/email.conf。重启OpsCenter。

为了发送告警给多个邮箱地址,建立不一样的邮箱配置文件,好比email1.conf,email2.conf

4.1.1.3.   案例

[email]
# set to 1 to enable email
enabled=1
# levels can be comma delimited list of any of the following:
# DEBUG,INFO,WARN,ERROR,CRITICAL,ALERT
# If left empty, will listen for all levels
levels=WARN
smtp_host=smtp.gmail.com
smtp_port=465
smtp_user=mercury@gmail.com
smtp_pass=*********
smtp_use_ssl=1
smtp_use_tls=0
smtp_retries=1
smtp_timeout=5
to_addr=cassandra_admin@acme.com
from_addr=mercury@gmail.com
# Customizable subject for email.  The key specified in {}'s must map to the items provided in json map at the end of
# the emails. For example, some available keys are:
#     node, cluster, datetime, level_str, message, target_node, event_source, success, api_source_ip, user, source_node
# more advanced formatting options explained here: https://docs.python.org/2/library/string.html#formatspec
subject=[{level_str}] OpsCenter Event on {cluster} - {message}

4.2.    配置文件

配置能力,能够修改opscenterd.conf,cluster_name.conf和address.yaml配置文件。

         注意:OpsCenterconsole是最方便修改配置文件的方式。

  • opscenterd.conf:配置OpsCenter daemon属性,路径install_location/conf/opscenterd.conf

  • cluster_name.conf:配置OpsCenter集群监控属性,路径install_location/conf/clusters/cluster_name.conf

  • address.yaml:配置DataStaxagent属性,路径install_location/conf/address.yaml。

    大部分的属性也能够在cluster_name.conf文件中的[agent_config]部分配置。

配置文件优先级:

Opscenter5.2以前版本cluster_name.conf配置优先于address.yaml。Opscenter5.2和以后版本,addresss.yaml优先于cluster_name.conf

4.2.1.       opscenterd.conf配置文件

注意修改文件属性后,须要重启Opscenter才能生效。

[webserver] port

OpsCenter webserver的HTTP链接端口。默认8888。

 

[webserver] interface

web server监听clientconnections的interface

 

[webserver] log_path

HTTP交互的日志路径,默认install_location/log/http.log

 

[logging] level

Opscenter日志级别,可用级别为:TRACE, DEBUG, INFO, WARN, ERROR。默认INFO

 

[logging] log_path

OpsCenter日志路径,默认install_location/log/opscenterd.log。

5.       OpsCenter使用

5.1.    OpsCenter workspace介绍

5.1.1.       主菜单

wKioL1ZZlpnDOjdiAAAeot_2xb0801.png

从主菜单访问OpsCenter如下功能:

  • New Cluster – 建立一个新的cluster或添加已经存在的cluster。

  • Alerts – 配置告警阀值。只有DataStax Enterprise可用

  • Settings – 访问编辑ClusterConnections和User Roles:

  •  

    • Cluster Connections – 修改集群设置或移除集群

  •  

    • Users & Roles – 管理用户基于角色认证

  • Help – OpsCenter资源信息

 

5.1.2.       导航菜单

wKiom1ZZlrDSnr0YAABNfMrPwGM500.png

  • Overview – 提供OpsCenter实例的集群概览。

wKioL1ZZl0mRkfcPAACBjJksrxM642.png

  • Dashboard –查看OpsCenter集群信息,监控Cassandra集群性能指标。

wKiom1ZZlxug7NMrAAC-o9yYZwM511.png

  • Nodes – 从不一样的角度查看集群(Ring or List View),执行集群节点的维护操做

wKioL1ZZl6PxbgeGAACgi-BdBoc182.png

  • Activities – 展现集群运行的任务,查看OpsCenter日志事件,好比在Eventlog中的OpsCenter启动中止。查看Spark jobs状态。查看那Hadoop Jobs状态。

wKioL1ZZl8Hya9miAABOzW48XoQ096.png

  • Data – 管理keyspaces和tables

wKiom1ZZl4LwRNKhAAA4q-TFfHE313.png

Services - DataStax Enterprise管理服务

 

5.2.    节点监控和管理

 

5.2.1.      Ring View

Ring View展现了集群节点做为ring的节点,能够今后诊断节点健康,数据分布等。点击cluster > Nodes> Ring,访问Ring View

wKiom1ZZl-HTOer2AADGzK_0AwY741.png

Ring view解释:

  • 健康概览。监控图标从左到右:Normal,Medium,High load,节点down

  • 颜色表示节点健康状态,由系统负载决定。0–0.999为Normal (green),1–5 Medium (yellow),5+ High (red),down(gray)

节点详情:

鼠标悬浮在节点上,将会展现节点详情。详情是实时更新的。

wKioL1ZZmHLwzIVlAABJoh9QD6Q269.png

点击节点,将会展现节点详情的对话框,展现更多的信息。使用Actions菜单能够在节点上运行多种操做。

wKiom1ZZmCzBUFg4AAD-lmmJV-A088.png

5.2.2.       List View

List View是RingView另外一种展现。List View提供了当查看数据时,更快的访问和更多的灵活性。全部数据都是实时更新的。

点击cluster > Nodes > Listtab,访问List View

wKioL1ZZmK2iE9WvAADToYvyeuQ868.png

查看节点详情:

点击节点,将会展现节点详情的对话框,展现更多的信息。使用Actions菜单能够在节点上运行多种操做。

wKiom1ZZmCzBUFg4AAD-lmmJV-A088.png

5.2.3.       节点管理操做

5.2.3.1.   管理单个节点

从List View或Ring View点击节点,从Actions菜单中选择action

wKioL1ZZmN3g0Bd9AAA6Pv6UCVo902.png

5.2.3.2.   操做详情

一、View Metrics

能够选择指标,生成监控图形

二、Configure

能够配置修改选中节点的cassandra.yaml文件

三、Start/Stop

启动或中止Cassandra进程。

四、Restart

重启Cassandra进程

五、Cleanup

移除节点的rows

六、Compact

执行压缩操做,在大部分Cassandra集群不建议操做。

七、Flush

将内存中的数据(memtables)flush到磁盘(SSTables)

八、Repair

修复副本数据的不一致性。

九、Perform GC

强制JVM执行GC操做

十、Drain

使当前写操做存储在memtables中的数据flush到SSTables,并使此节点变为只读。节点将再也不接受新的写入操做。Drain通常用于升级节点。

5.3.    管理keyspaces和tables

5.3.1.       管理keyspaces

步骤:

一、点击左边导航窗口中的Data。展现Keyspaces列表

wKioL1ZZmVXTJ6dtAADDEwwO2Ew538.png

二、选择Keyspaces列表中的一个keyspace

wKiom1ZZmRKzVwIFAADmiqWK0oA753.png

三、在keyspace settings中,点击Edit

wKiom1ZZmXvwVRwOAABmAk0Tv7A890.png

四、点击Delete Keyspace,删除keyspace

5.3.2.       管理tables

步骤:

  1. 点击左边导航窗口中的Data。展现Keyspaces列表

  2. 选中tables列表中的table,将会展现table的CQL statement

wKioL1ZZmgSAcRq5AAC7dTOmu1A544.png

三、其余操做:

  •  Delete:从keyspace中删除此表

  •  View Metrics:展现table的指标

  •  Truncate:删除此表的全部数据

5.4.    集群管理

5.4.1.       删除集群

步骤:

  1. 从主菜单上,点击Settings >Cluster Connections

wKiom1ZZmjbg38lhAACHn1zgGTI157.png

二、点击Delete Cluster

5.4.2.       重启集群

步骤:

  1. 点击ClusterActions菜单中的Restart

wKioL1ZZmtHi8rd1AABWeRvl9fs760.png

二、设置每一个节点重启后等待时间。默认60s

三、可选的:选择是否执行Drain在中止以前。

四、点击Restart Cluster

5.4.3.       产生PDF报告

点击Help >Report将产生集群监控PDF报告

wKioL1ZZmwLxR5gnAAAXMV7C5hk691.png

5.5.    性能指标

5.5.1.       使用性能指标

选择Dashboard查看指标类型:

  • 集群性能指标

  • Task指标

  • Table指标

 

5.5.1.1.      建立和编辑性能图

图标能够在一个单元中包含多个指标。好比,一个图标能够包含CPU和磁盘的利用率,读写请求和系统负载。

能够展现告警,集群健康和存储容量。

步骤:

一、点击Dashboard

二、点击Add Graph

三、在Add Metric对话框,选择指标

wKioL1ZZm1DS2czXAACWocsrAn8030.png

四、选择监控的节点

五、可选的:点击table,选择特定的表

六、点击Add Metric

七、点击Save Graph展现指定的指标图表

八、点击图标右上角的title,点击Edit Graph能够编辑图表

wKiom1ZZm3SDOlMxAACSl8L0070613.png

九、点击Add Widget能够开启和关闭Alerts, Cluster Health和Storage Capacity

wKiom1ZZm6iBJZfFAAAh8_Fst54857.png

5.5.1.2.   分组设置性能指标

步骤:

一、点击Dashboard

wKioL1ZZnCvjHrMZAAAidNA9zf8106.png

二、点击Clone能够克隆指标图表

三、点击Make Default,设置为默认

四、点击Rename,能够重命名

五、点击Delete,能够删除

5.5.1.3.   导出导出dashboard

Dashboard导出导入为JSON文件

编辑opscenterd.conf,重启opscenterd

[labs]

enable_dashboard_preset_import_export = True

步骤:

一、点击Dashboard,点击Export

wKioL1ZZnJvy408vAABQcMQbbjk575.png

二、点击Import链接

wKiom1ZZnFaC3M0LAACNOoKpIzw726.png

5.5.2.       集群性能指标

CassandraJVM memory usage

Cassandra 进程使用Java heapmemory的平均值

 

WriteRequests

在coordinator节点上每秒的写请求数,相似与client写请求

 

WriteRequest Latency

Client写响应平均时长(以毫秒为单位)。依赖于consistencylevel和replication factor,也包含了写replicas的网络延迟

 

Read Requests

在coordinator节点上每秒的读请求数,相似与client读请求

 

ReadRequest Latency

Client读响应平均时长(以毫秒为单位)。read latency受到硬盘,网络和应用程序读的方式等影响。好比,使用二级索引,读请求数据大小,client须要的consistency level都将影响read latency。I/O的争用也会增长read latency。当SSTables有不少碎片,compaction跟不上写负载则读也会变慢。

 

JVMCMS Collection Count

JVM每秒并发标记-清除(CMS)垃圾的数量。

 

JVMCMS Collection Time

CMS垃圾收集时间(ms/sec)

 

JVMParNew Collection Count

JVM每秒并行执行的新一代垃圾收集的数量

 

JVMParNew Collection Time

ParNew垃圾收集时间(ms/sec)

 

DataSize

Cassandra存储数据的大小。建议不超过磁盘的70%,留一些空间维护compaction和repair操做。

 

Totalbytes compacted

SSTable每秒数据压缩的字节数

 

Totalcompactions

每秒压缩的数量

 

5.5.3.       Pending任务指标

Pending tasks经常是由缺乏集群资源引发,好比磁盘带宽,网络带宽和内存。

5.5.3.1.   Pending task metrics forwrites(写等待任务指标)

FlushesPending

Flush进程flush memtables到SSTables。这个指标展现了flushmemtables队列的数量。最优数量为0(或较少数量)。值大于0表示有I/O竞争,下降了磁盘性能

 

Repl.(Replicate) on Write TasksPending (复制等待任务指标)

当插入或修改一行时,此行将会复制到其余节点。调用的是ReplicateOnWriteStage。这个指标跟踪了写进程阶段。在一个低或适中的写负载时,你应该看到0 pending replicate在写任务上(或比较低的数字)。持续的高值表示须要检查下磁盘I/O或网络链接问题

 

5.5.3.2.   Pending task metrics forreads(读等待任务指标)

ReadRequests Pending

到达集群等待处理的读请求的数量。在一个低或适中的写负载时,你应该看到0 pending read在写任务上(或比较低的数字)。持续的高值表示须要检查下磁盘I/O或网络链接问题。Pending reads也可能表示应用设计没有以有效的方式来访问数据

 

ReadRepair Tasks Pending

读修复操做队列,等待系统资源的数量。最优数量为0(或比较低的数字)。值大于0表示读修复操做与其余操做存在I/O竞争。对于表来讲,下降此table参数read_repair_chance,你须要容忍必定程度的旧数据。

 

CompactionsPending

Compactions队列的数量,等待系统资源。最优数量为0(或比较低的数字)。值大于0表示读操做与compaction操做竞争I/O链接,表示读性能降低。这种状况经常是因为执行频繁的small writes和持久的reads。若是一个节点或集群展现了pending compactions,表示你可能须要增大I/O能力,经过添加节点到集群。你也能够减小I/O链接,经过减小插入/更新请求(好比批量写入)。或则减小SSTables建立的数量,经过增大memtable大小,flush频率。

 

5.5.3.3.   Pending task metrics forcluster operations(集群操做等待任务指标)

Manualrepair tasks pending

Repair操做数量。Repair是一个资源敏感操做,须要执行:比较副本间的数据,发送改变的row到副原本保证数据的一致性,删除过时的tombstones,重建索引和bloom filters。跟踪这个指标的状态能够帮助你肯定repaire操做的过程。它经常不会出现很大的值。

 

Gossiptasks pending

Cassandra使用gossip协议来发现其余节点的位置和状态信息。每一个节点每秒发送一次gossip,与其余节点交换状态信息。Gossip tasks pending表示gossip messages等待发送或接受的数量。最优数量为0(或比较低的数字)。值大于0表示网络可能有问题。

 

Hintedhandoff pending

当一个节点offline,其余节点在节点不可用期间将会保存rows更新的提示。当节点从新online,它对应的副本将会修复。hinted handoff pending指标表示等待发送给failed节点hints的数量。查看这个指标能够肯定failed节点数据是否恢复。Hinted handoff是Cassandra可选的功能。Hints能够配置保存周期(默认1小时)。

 

Miscellaneoustasks pending

系统修改schema后的等待任务数量。Schema修改须要传播给全部的节点,因此这个指标可以表示schema 不一致的错误。

5.5.4.       Table性能指标

TBL:Local Writes

表的写负载。指标包含全部的写请求到此table,包含来自其余节点的写请求。

 

TBL:Local Write Latency

成功写入表后的响应事件,单位毫秒。writelatency受到硬盘,网络和写入性质影响(好比consistency levels)

 

TBL:Write Latency (Stacked)

写数据的响应事件,包含min,median, max, 90%和99%

 

TBL:Local Reads

读负载

 

TBL:Local Read Latency

成功读取数据后的响应事件

 

ReadLatency (Stacked)

读数据的响应事件,包含min, median, max, 90%和99%

 

TBL:Live Disk Used

存活的SSTables使用的磁盘空间,不包含过期的SSTables

 

TBL:Total Disk Used

SSTables使用的磁盘空间,包含过期的SSTables

 

TBL:SSTable Count

SSTables当前数量

 

TBL:SSTables per Read (Stacked)

读取多少SSTables:包含min,median, max, 90%和99%

 

TBL:Cell Count

表在分区中存在多少个cells:包含min,median, max, 90%和99%

 

TBL:Partition Size

表的分区大小:包含min, median,max, 90%和99%

 

TBL:Pending Reads/Writes

表的读写等待数量。

 

TBL:Bloom Filter Space Used

bloomfilter文件在磁盘的大小。

 

TBL:Bloom Filter False Positives

bloom filter误报的数量,好比bloomfilter表示row存在,但实际上不存在的数量

 

TBL:Bloom Filter False Positive Ratio

bloomfilter误报的百分比

 

TBL:Bloom Filter Off Heap

bloomfilters使用的heap memory

 

TBL:Index Summary Off Heap

索引使用的heapmemory

 

TBL:Compression Metadata Off Heap

compressionmetadata使用的heap memory

 

TBL:Memtable Off Heap

表当前的memtable使用的heapmemory

 

TBL:Total Memtable Size

全部的memtables使用内存的空间

 

TBL:Key Cache Requests

在row key cache读请求的数量

 

TBL:Key Cache Hits

在row keycache读请求命中的数量

 

TBL:Key Cache Hit Rate

在row keycache读请求命中的比率

 

TBL:Row Cache Requests

在row key cache读请求的数量,这个指标只是展现配置的row caching(row caching默认不可用)

 

TBL:Row Cache Hits

在row key cache读请求命中的数量,这个指标只是展现配置的row caching(row caching默认不可用)

 

TBL:Row Cache Hit Rate

在row key cache读请求命中的比率,这个指标只是展现配置的row caching(row caching默认不可用)

 

TBL:SSTable Size

表当前SSTables当前大小

5.5.5.       操做系统性能指标

OS:Memory

展现系统内存的使用:cached,buffered和free

 

OS:CPU

系统和用户进程使用CPU的时间

 

OS:Load

系统work数量

 

OS:Disk usage (GB)

Cassandra使用磁盘空间

 

OS:Disk Usage (percentage)

Cassandra使用磁盘空间的百分比

 

OS:Disk Throughput

读写操做的百分比,经过测量每秒的MB

 

OS:Disk Rates

磁盘对于读写操做的平均速度

 

OS:Disk Latency

磁盘查找消耗的平均时间,单位毫秒

 

OS:Disk Request Size

请求的平均大小

 

OS:Disk Queue Size

请求队列的平均数量,对于磁盘延迟问题

 

OS:Disk Utilization

磁盘I/O消耗CPU时间的百分比