「Flink」Flink 1.9 WebUI运行做业界面分析

运行做业界面

在如下界面中,能够查看到做业的名称、做业的启动时间、做业总计运行时长、做业一共有多少个任务、当前正在运行多少个任务、以及做业的当前状态。oop

这里的程序:一共有17个任务,当前正在运行的是17个任务。spa

image

做业概览界面

image

在这个界面中,咱们能够看到数据流图。这个程序中,一共有3个算子。3d

image

Custom Source任务并行度为1blog

Flat Map任务并行度为8,内存

Flink Map –> Sink任务并行度为8hadoop

一共是17个任务。get

在明细界面中,能够查看到具体每一个算子接收的字节数、记录数,发送的字节数、记录数,并行度,开始时间,持续运行时间。it

image

具体Operator运行状况

点击某一个Operator,能够查看到该Operator的具体运行信息。spark

image

上图,咱们能够看到Task处理的数据是均匀的,每个Task都拉取到了差很少的记录数。io

而下面这张图,咱们能够很直观地看到,3个分区中是有数据处理的。由于此处咱们只有三个单词:hadoop flink spark。每一个单词都分配到了不一样的任务中处理。

image


Checkpoint界面

image

Overview

Overview中能够看到Checkpoint的整体概览状况。

image

Triggered表示一共触发了14个checkpoint,完成了14个。

image

Lastest Completed Checkpoint为最近一次checkpoint的状况,能够看到这个checkpoint在state中存储的大小是5.9KB。

再看一下这个checkpoint的明细信息:

image

能够看到这个checkpoint并无配置外部的存储,是保存在Task Manager的内存走过来的。并且这个Checkpoint已经被discard掉了。

再看下具体Operators的checkpoint状况,在Flink中每一个Operator都是有状态的。

第一个Source、第二个Flat Map,这两个Operator都没有实现Operator State(也就是CheckpointFunction),因此,他们并无真正的占用状态存储。

而在第三个FlatMap –> Slink Operator走过来,由于使用到了Keyed Manage State中的ValueState,因此,这里状态存储中是有值的。

image

History

在History选项卡中,咱们能够看到全部的checkpoint的历史记录

image

Summary

image

Summary中,能够看到checkpoint的运行时间。

相关文章
相关标签/搜索