JavaShuo
栏目
标签
Spatio-Temporal Fusion based Convolutional Sequence Learning for Lip Reading论文阅读
时间 2021-01-11
标签
# CV论文阅读
繁體版
原文
原文链接
Abstract 目前最先进的唇读方法是基于自然机器翻译和音频语音识别的seq2seq架构。但是这种方案没有充分利用唇动的特征,有两种缺陷:首先是短期的时间依赖关系是嘴唇图像到发音嘴型映射的关键但是没有接收足够的注意力;二是在现有的序列模型中由于使用了全局池化导致局部空间信息的丢失。 本文提出了一个时间聚焦块来充分描述短期依赖关系,同时提出一个时空融合模块来保持局部空间信息并降低特征维度。实验结果
>>阅读原文<<
相关文章
1.
论文阅读:《 Lip Reading Sentences in the Wild》
2.
论文阅读笔记(四十):Learning Spatiotemporal Features with 3D Convolutional Networks(C3D)
3.
Paper Reading - Convolutional Sequence to Sequence Learning ( CoRR 2017 ) ★
4.
【论文阅读】Convolutional Sequence to Sequence Learning (未完待续)
5.
【论文阅读笔记】Learning Spatiotemporal Features with 3D Convolutional Networks
6.
Machine Learning & Deep Learning 论文阅读笔记
7.
Convolutional Sequence to Sequence Learning 论文笔记
8.
论文阅读笔记《leaning spatiotemporal features with 3D convolutional network》
9.
论文阅读《Spatiotemporal Multiplier Networks for Video Action Recognition》
10.
论文阅读——FPGA based Accelerators ofDeep Learning Networks for Learning andClassification:A Review
更多相关文章...
•
RSS 阅读器
-
RSS 教程
•
PHP 实例 - AJAX RSS 阅读器
-
PHP教程
•
JDK13 GA发布:5大特性解读
•
Scala 中文乱码解决
相关标签/搜索
论文阅读
CV论文阅读
sequence
fusion
based
spatiotemporal
convolutional
reading
lip
外文阅读
Thymeleaf 教程
PHP教程
Redis教程
文件系统
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
在windows下的虚拟机中,安装华为电脑的deepin操作系统
2.
强烈推荐款下载不限速解析神器
3.
【区块链技术】孙宇晨:区块链技术带来金融服务的信任变革
4.
搜索引起的链接分析-计算网页的重要性
5.
TiDB x 微众银行 | 耗时降低 58%,分布式架构助力实现普惠金融
6.
《数字孪生体技术白皮书》重磅发布(附完整版下载)
7.
双十一“避坑”指南:区块链电子合同为电商交易保驾护航!
8.
区块链产业,怎样“链”住未来?
9.
OpenglRipper使用教程
10.
springcloud请求一次好用一次不好用zuul Name or service not known
本站公众号
欢迎关注本站公众号,获取更多信息
相关文章
1.
论文阅读:《 Lip Reading Sentences in the Wild》
2.
论文阅读笔记(四十):Learning Spatiotemporal Features with 3D Convolutional Networks(C3D)
3.
Paper Reading - Convolutional Sequence to Sequence Learning ( CoRR 2017 ) ★
4.
【论文阅读】Convolutional Sequence to Sequence Learning (未完待续)
5.
【论文阅读笔记】Learning Spatiotemporal Features with 3D Convolutional Networks
6.
Machine Learning & Deep Learning 论文阅读笔记
7.
Convolutional Sequence to Sequence Learning 论文笔记
8.
论文阅读笔记《leaning spatiotemporal features with 3D convolutional network》
9.
论文阅读《Spatiotemporal Multiplier Networks for Video Action Recognition》
10.
论文阅读——FPGA based Accelerators ofDeep Learning Networks for Learning andClassification:A Review
>>更多相关文章<<