文章目录

引入

使用神经网络的多示例端到端优化是一个很重要的问题：如何在不损失过多实例级别信息的同时设计一个序列不变 (permutation-invariant)池化函数。
受胶囊网络 (capsule networks)中动态路由 (dynamic routing)的启发，本文提出了一个新颖的针对MIL的动态池化函数：针对关键实例的自适应，以及对包中实例的上下文信息 (contextual information )进行建模。
具体的，动态池迭代的更新实例对所属包的贡献程度，其具备序列不变的性质，以及可以解释实例到包的关系。html

【1】http://proceedings.mlr.press/v95/yan18a/yan18a.pdfweb

1 多示例神经网络的动态池化

主要内容：
1）多示例学习基本概念；
2）DP-MINN;
3）相关讨论。网络

1.1 多示例学习

部分符号表以下：svg

符号	含义
$\{ x_1, x_2, \cdots, x_K \}$	包
$x_i$	包中第 $i$ 个 $d$ 维特征向量
$K$	包大小
$\in \{ 0, 1 \}$	标签空间

符号点评：
1） $x_i$ 是一个向量，推荐使用 $\boldsymbol{x}_i$ ;
2） $K$ 表示包的大小，是一个常量，而 $K$ 经常使用来表示矩阵等。函数

1.1.1 问题说明

实例到包的依赖关系随着多示例 (MI)假设的变化而变化，与已有的工做不一样，本文不固定使用某一MI假设，而将重点放在模型的构建上。学习

1.1.2 序列不变性

MI中，包中的实例是一组特征的集合，其没有特定的顺序。所以，MI数据的一个重要特色是输入序列的不变性 (permutation invariance)基于对称函数基本定理 $\color{red}^{[1, 2]}$ ，任意序列不变对称函数 $M$ 能够分解维以下：
$\rho (\sum_{x \in X} \phi (x)). \tag{1}$ 其中 $\rho$ 和 $\phi$ 表明适当的转换 (一号坑：怎么转换？)。优化

点评：
1）公式中使用的"."，应该把公式看做是一个句子。ui

注：
【1】Manzil Zaheer, Satwik Kottur, Siamak Ravanbakhsh, Barnabas Poczos, Ruslan R Salakhutdinov, and Alexander J Smola. Deep sets. In Advances in Neural Information Processing Systems, pages 3394–3404, 2017.
【2】Charles R Qi, Hao Su, Kaichun Mo, and Leonidas J Guibas. Pointnet: Deep learning on point sets for 3d classification and segmentation. Proc. Computer Vision and Pattern Recognition (CVPR), IEEE, 1(2):4, 2017.lua

1.1.3 MIL与神经网络

已有的MI-Net $\color{red}^{[1]}$ 和AttentionNet $\color{red}^{[2]}$ 分为三步：
1）经过实例转换，习得实例嵌入；
2）经过一个序列不变MIL池生成包嵌入；
3）基于包嵌入分类包。
第二步是关键，上面两篇文章中的大佬已经定义了几个池化函数 (这里没讲，由于很快“窝们”就要提出本身的了)。spa

1.2 动态池化

已有的MIL动态池化方法，很难，对包中实例的上下文信息建模，由于其迟缓函数是前向传递，且实例之间的权重是单独计算的。
受胶囊网络启发，本文提出了称为动态池化 (dynamic pooling)的协议池化 (pooling-by-agreement)策略。
为了方面讲故事，首先定义实例转换函数 $(\cdot)$ 、实例嵌入函数 $\{ f (x_1), f_(x_2), \cdots, f (x_K) \}$ 。
本文的动态池化函数能够表示以下的权重累加池化：
$\tag{2} \sigma (X) = \sum_{i = 1}^K c_i f (x_i),$ 其中实例权重 $c_i$ 是一个描述实例 $x_i$ 与相应包嵌入的分布的标量 (二号坑： $(\cdot)$ 是啥？ $c_i$ 怎么来？)。
基于这些权重，本文使用公式 (2)汇聚实例嵌入维包的嵌入，并使用一个非线性 “squashing”函数，使得短向量缩短到几乎零长度，长向量缩短到低于 $1$ ：
$\tag{3} s (X) = \frac{ {\| \sigma (X) \|}^2}{1 + {\| \sigma (X) \|}^2} \frac{\sigma (X)}{\| \sigma (X) \|}.$ 与已有MIL池化函数不一样，本文中实例权重 $c_i$ 为动态计算所得。为了描述这一过程，本文定义了一个临时实例权重 $b_i$ 。而后， $c_i$ 经过一个简单的softmax函数计算 (二号坑的 $c_i$ 解决)：
$\tag{4} c_i = \frac{\exp (b_i)}{\sum_j \exp (b_j)}.$ 为了简化，上标 $t$ 表示迭代次数：
1）初始化， $t = 1$ ， $b_i^1 = 0$ 表示包中实例对包嵌入等贡献；

【1】Xinggang Wang, Yongluan Yan, Peng Tang, Xiang Bai, and Wenyu Liu. Revisiting multiple instance neural networks. Pattern Recognition, 74:15–24, 2018.
【2】Maximilian Ilse, Jakub M Tomczak, and Max Welling. Attention-based deep multiple instance learning. arXiv preprint arXiv:1802.04712, 2018.

本文同步分享在博客“因吉”（CSDN）。
若有侵权，请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”，欢迎正在阅读的你也加入，一块儿分享。

论文阅读 (十九)：Deep Multi-instance Learning with Dynamic Pooling (2018DP-MINN)