ETH-DS3Lab at SemEval-2018 Task 7: Effectively Combining Recurrent and Convolutional Neural Networks for Relation Classification and Extraction
@theodoric008 推荐
Relation Extractiongit
本文来自苏黎世联邦理工学院 DS3Lab,文章针对实体关系抽取任务进行了很是系统的实验,并在第十二届国际语义评测比赛 SemEval 2018 的语义关系抽取和分类任务上得到冠军。本文思路严谨,值得国内学者们仔细研读。github
论文连接
https://www.paperweekly.site/papers/1833算法
Personalizing Dialogue Agents: I have a dog, do you have pets too?
@yihongchen 推荐
Dialogue System网络
本文是 Facebook AI Research 发表于 NIPS 2018 的工做。论文根据一个名为 PERSONA-CHAT 的对话数据集来训练基于 Profile 的聊天机器人,该数据集包含超过 16 万条对话。框架
本文致力于解决如下问题:ide
聊天机器人缺少一致性格特征布局
聊天机器人缺少长期记忆学习
聊天机器人常常给出模糊的回应,例如 I don't know优化
论文连接
https://www.paperweekly.site/papers/1802
数据集连接
https://github.com/facebookresearch/ParlAI/tree/master/parlai/tasks/personachat动画
DiSAN: Directional Self-Attention Network for RNN/CNN-Free Language Understanding
@zhkun 推荐
Natural Language Understanding
本文是悉尼科技大学发表于 AAAI 2018 的工做,这篇文章是对 Self-Attention 的另外一种应用,做者提出一种新的方向性的 Attention,从而能更加有效地理解语义。
论文连接
https://www.paperweekly.site/papers/1822
代码连接
https://github.com/shaohua0116/Group-Normalization-Tensorflow
DetNet: A Backbone network for Object Detection
@chlr1995 推荐
Object Detection
本文来自清华大学和 Face++,文章分析了使用 ImageNet 预训练网络调优检测器的缺陷,研究经过保持空间分辨率和扩大感觉野,提出了一种新的为检测任务设计的骨干网络 DetNet。
实验结果代表,基于低复杂度的 DetNet59 骨干网络,在 MSCOCO 目标检测和实例分割追踪任务上都取得当前最佳的成绩。
论文连接
https://www.paperweekly.site/papers/1844
Imagine This! Scripts to Compositions to Videos
@chlr1995 推荐
Video Caption
本文以《摩登原始人》的动画片断做为训练数据,对每一个片断进行详细的文本标注,最终训练获得一个能够经过给定脚本或文字描述生成动画片断的模型。
模型称为 Craft,分为布局、实体、背景,三个部分。虽然现阶段模型存在着不少问题,可是这个研究在理解文本和视频图像高层语义方面有着很大的意义。
论文连接
https://www.paperweekly.site/papers/1838
Generating Diverse and Accurate Visual Captions by Comparative Adversarial Learning
@Aidon 推荐
Image Caption
本文来自华盛顿大学和微软,文章提出一个基于 GAN 的 Image Caption 框架,亮点以下:
论文连接
https://www.paperweekly.site/papers/1842
Simultaneously Self-Attending to All Mentions for Full-Abstract Biological Relation Extraction
@robertdlut 推荐
Self-Attention
本文是 Andrew McCallum 团队应用 Self-Attention 在生物医学关系抽取任务上的一个工做。这篇论文做者提出了一个文档级别的生物关系抽取模型,做者使用 Google 提出包含 Self-Attention 的 transformer 来对输入文本进行表示学习,和原始的 transformer 略有不一样在于他们使用了窗口大小为 5 的 CNN 代替了原始 FNN。
论文连接
https://www.paperweekly.site/papers/1787
代码连接
https://github.com/patverga/bran
Evaluation of Session-based Recommendation Algorithms
@Ttssxuan 推荐
Recommender System
本文系统地介绍了 Session-based Recommendation,主要针对 baseline methods, nearest-neighbor techniques, recurrent neural networks 和 (hybrid) factorization-based methods 等 4 大类算法进行介绍。
此外,本文使用 RSC1五、TMALL、ZALANDO、RETAILROCKET、8TRACKS 、AOTM、30MUSIC、NOWPLAYING、CLEF 等 7 个数据集进行分析,在 Mean Reciprocal Rank (MRR)、Coverage、Popularity bias、Cold start、Scalability、Precision、Recall 等指标上进行比较。
论文连接
https://www.paperweekly.site/papers/1809
代码连接
https://www.dropbox.com/sh/7qdquluflk032ot/AACoz2Go49q1mTpXYGe0gaANa?dl=0
On the Convergence of Adam and Beyond
@chlr1995 推荐
Neural Network
本文是 ICLR 2018 最佳论文之一。在神经网络优化方法中,有不少相似 Adam、RMSprop 这一类的自适应学习率的方法,可是在实际应用中,虽然这一类方法在初期降低的很快,可是每每存在着最终收敛效果不如 SGD+Momentum 的问题。
做者发现,致使这样问题的其中一个缘由是由于使用了指数滑动平均,这使得学习率在某些点会出现激增。在实验中,做者给出了一个简单的凸优化问题,结果显示 Adam 并不能收敛到最优势。
在此基础上,做者提出了一种改进方案,使得 Adam 具备长期记忆能力,来解决这个问题,同时没有增长太多的额外开销。
论文连接
https://www.paperweekly.site/papers/1841
Neural Baby Talk
@jamiechoi 推荐
Image Captioning
本文是佐治亚理工学院发表于 CVPR 2018 的工做,文章结合了 image captioning 的两种作法:之前基于 template 的生成方法(baby talk)和近年来主流的 encoder-decoder 方法(neural talk)。
论文主要作法其实跟做者之前的工做"Knowing When to Look: Adaptive Attention via A Visual Sentinel for Image Captioning"相似:在每个 timestep,模型决定生成究竟是生成 textual word(不包含视觉信息的链接词),仍是生成 visual word。其中 visual word 的生成是一个自由的接口,能够与不一样的 object detector 对接。
论文连接
https://www.paperweekly.site/papers/1801
代码连接
https://github.com/jiasenlu/NeuralBabyTalk
Context Encoding for Semantic Segmentation
@wanzysky 推荐
Semantic Segmentation
本文提出了一种与类别预测相关的网络结构,使得在必定程度上下降了分割任务的难度。Channel attention 和空间 attention 造成互补,Global contextual loss 加强 context 信息,同时提升了小物体的分割精度。
论文连接
https://www.paperweekly.site/papers/1814
代码连接
https://github.com/zhanghang1989/PyTorch-Encoding
Adaptive Graph Convolutional Neural Networks
@VIPSP 推荐
Convolutional Neural Network
图卷积神经网络(Graph CNN)是经典 CNN 的推广方法,可用于处理分子数据、点云和社交网络等图数据。Graph CNN 中的的滤波器大可能是为固定和共享的图结构而构建的。可是,对于大多数真实数据而言,图结构的大小和链接性都是不一样的。
本论文提出了一种有泛化能力且灵活的 Graph CNN,其可使用任意图结构的数据做为输入。经过这种方式,能够在训练时为每一个图数据构建一个任务驱动的自适应图(adaptive graph)。
为了有效地学习这种图,做者提出了一种距离度量学习方法。而且在九个图结构数据集上进行了大量实验,结果代表本文方法在收敛速度和预测准确度方面都有更优的表现。