论文阅读 | Formalizing Visualization Design Knowledge as Constraints: Actionable and Extensible Models i

时间 2019-12-11

标签论文阅读 formalizing visualization design knowledge constraints actionable extensible models 繁體版

原文原文链接

1. Introduction

程序员编写的可视化图表与专家眼中的设计标准总存在差距。咱们没法每次都向可视化专家咨询设计上的意见，因此咱们需求将设计标准，研究成果应用于自动化设计工具的正式框架，这些工具备助于对于推荐数据的合理编码和正确的视觉探索方式。咱们建议将可视化设计标准建模为约束的集合，并结合从实验数据中学习到的软约束的权重，使用求解器把理论设计知识具体的，可扩展和可测试的表达出来的系统。咱们使用Draco实现了咱们的想法，Draco是一个基于答案集编程（ASP）的基于约束的系统。本文的贡献能够归纳为如下三点：git

本文提出了一种自动化可视设计的规范框架，使用一些设计规范来帮助用户制做好的可视化设计
本文将可视化设计建模为约束条件进行最优化求解，有些约束条件是硬性条件(必须知足)，有些是软性条件(带有惩罚)
本文基于Clingo，这是一种基于答案集编程(ASP)的求解器，还有Vega-Lite, 这是一种json化的可视化图表语法

Visual Encoding Principles程序员

可视化设计标准定义了在可视化图表当中最基本的概念，mark是可视化中的基本图形元素，channel是表达数据的方式和频道。比方说一张折线图，它的mark是线段，channel是位置(高低)。github

除此以外，可视化还将数据类型data定义为：continuous(数值型，10英尺，23岁)，ordered(离散型，有大小之分，如星期几)，categorical(离散型，无大小之分，如苹果，梨子)三类。将处理数据Aggregate分为，sum, mean，count，median。算法

Vega-lite编程

Vega-Lite吸取了前任对于视觉编码的研究成果，并参考了d3，visQL(tableau前身)等可视化语言。 Vega-Lite结合了传统的图形语法，提供了可视化编码规则和分层和多视图显示。用户经过组合选择来指定交互式语义。在Vega-Lite中，选择是一种抽象，它定义输入事件处理，兴趣点和包含测试的谓词函数。选择经过用做输入数据，定义比例范围或经过驱动条件逻辑来参数化可视编码。 Vega-Lite编译器自动合成必需的数据流和事件处理逻辑，用户能够覆盖这些逻辑以进行进一步的自定义。json

Automated Visualization Design
过去的自动化设计系统使用预先设计的规则对用户的需求进行断定，经过聚类和穷举(dfs)，最后获得一个有限集合，经过rankSVM等排序算法，获得最后的偏好。这种方案的缺陷在于，穷举的搜索策略是深度优先搜索，复杂度过大，还有不少回溯，这对于大型设计空间来讲效率低。 Draco使用现代约束求解器和标准化的表示语言，而且还提出了软约束的概念，增长了灵活性。最近的一篇自动可视设计系统是来自idl实验室的Voyager 2。框架

3. Modeling Visualization Design In Draco

硬性可视化约束规范

如前文所述，Draco当中的规则分为硬规则和软规则。硬规则包括一些可视化图表内部的逻辑(比方说折线图没法表示种类等等)，还有许多用户本身定义的偏好。这些规则必须被知足。函数

Mark ∈ {bar, line, area, point}工具
Channel ∈ {x, y, color, text, shape}学习
Field ∈ {site, year, age}
Type ∈ {categorical, continuous}
Aggregate ∈ {sum, mean, count, median}
Zero ∈ {yes, no}

咱们还能够写多条件硬规则，以下所示

:- X

X这种状况不会发生

:- channel(_,shape), not mark(point)

代表对于形状编码必须是是“点” ，其余标记类型（如区域，线，条或文本）不能对形状进行编码。

:- mark(bar), channel(E, y), continuous(E), not zero(E)

代表必须使用零做为基线的垂直条形图。

软性可视化约束规范

:~ X [w]

倾向于X这种状况不会发生，若是违反那么会有w的惩罚

:~ continuous(E), not zero(E) [5]

表示模型更喜欢连续字段的坐标从零开始，而且违反规则会使这个模型的cost增长5

经过如下的语句定义数据的信道偏好设置

:~ channel(E,y), type(E,nominal). [0]
:~ channel(E,x), type(E,nominal). [1]
:~ channel(E,column), type(E,nominal). [2] 
:~ channel(E,color), type(E,nominal). [3]

假设咱们有m个软性约束，pi为第i个约束，每一个约束的惩罚为wi

令 S = {(p1, w1)… (pi, wi)} npi(v)是v这种视图违反软约束pi的次数，那么Cost能够定义为：$Cost(v)=\sum_{i=1..k}wi*n_{pi}(v)$

这样咱们经过求解器能够经过这些权值获得不一样可视化图表的偏好。

4. User Study

比较试验

本文将Draco与voyager2中使用的CompassQL求解算法作比较，将CompassQL中的规定转成Draco中的 -: X(硬规则)，将CompassQL中的偏化转成Draco中的 ~:X(软规则)。实验结果能够发现，CompassQL中复杂的规则语句在Draco只须要短短几句。

使用rankSVM训练软约束参数

本文使用lY. Kim and J. Heer. Assessing effects of task and data distribution on the effectiveness of visual
encodings,和 lB. Saket, A. Endert, and C. Demiralp. Task-based effectiveness of basic visualizations. 所用到的实验数据，训练软约束参数，得到了比原先自定义不一样的可视化结果。

5. Conclusion

做为今年infovis的best paper，本篇文章确实可圈可点，本论文的文档，在线演示能够看https://uwdata.github.io/draco/。下面是总结

本文提出了目前最完整的自动化可视设计框架
这个框架具备高度灵活性和可训练性
将来它将支持推荐更复杂的图表或者仪表盘
这个系统为理解可视化语法，创新可视化设计，理解不一样编码的感知都有不可或缺的做用

论文阅读 | Formalizing Visualization Design Knowledge as Constraints: Actionable and Extensible Models i

1. Introduction

2. Related Work

3. Modeling Visualization Design In Draco

4. User Study

5. Conclusion