JavaShuo
栏目
标签
文字图像处理之跨模态检索和VQA视觉问答
时间 2021-01-17
标签
深度学习
机器学习
栏目
搜索引擎
繁體版
原文
原文链接
以下内容全是学习自一位学长的读书笔记!!!! 1.跨模态检索 他的定义就是将一个模态的数据(我暂且将认为是图片)作为查询去检索了一个与之相关的模态(我认为可以是视频)的数据,作为查询接过来返回。 一般会将模态分为: 1.自然语言处理(这就是传说中自然语言呀,写和说) 2.视觉信号(也就是图片和视频) 3.声音信号(对声音的编码和韵律) 这就像在输入文字的搜索引擎上面找对应的图片和视频,这就是跨模态
>>阅读原文<<
相关文章
1.
图像检索:INS视觉检索
2.
数字图像处理:视觉概述
3.
跨模态图文检索:浅谈SCRATCH
4.
跨模态图文检索:浅谈SPGCM
5.
文字图像处理之视觉蕴涵
6.
【计算机视觉】图像检索
7.
跨模态检索
8.
跨模态检索:带你领略图文检索的魅力
9.
【天然语言处理】--视觉问答(Visual Question Answering,VQA)从初始到应用
10.
【自然语言处理】--视觉问答(Visual Question Answering,VQA)从初始到应用
更多相关文章...
•
PHP 图像处理
-
PHP参考手册
•
PHP 文件处理
-
PHP教程
•
☆技术问答集锦(13)Java Instrument原理
•
PHP Ajax 跨域问题最佳解决方案
相关标签/搜索
图像处理
文字处理
图像-视频处理
数字图像处理
python图像处理
OpenCV图像处理
Matlab图像处理
OpenCV3图像处理
matlab 图像处理
vqa
快乐工作
搜索引擎
XLink 和 XPointer 教程
NoSQL教程
PHP教程
跨域
静态资源
文件系统
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
css 让chrome支持小于12px的文字
2.
集合的一点小总结
3.
ejb
4.
Selenium WebDriver API
5.
人工智能基础,我的看法
6.
Non-local Neural及Self-attention
7.
Hbuilder 打开iOS真机调试操作
8.
improved open set domain adaptation with backpropagation 学习笔记
9.
Chrome插件 GitHub-Chart Commits3D直方图视图
10.
CISCO ASAv 9.15 - 体验思科上一代防火墙
本站公众号
欢迎关注本站公众号,获取更多信息
相关文章
1.
图像检索:INS视觉检索
2.
数字图像处理:视觉概述
3.
跨模态图文检索:浅谈SCRATCH
4.
跨模态图文检索:浅谈SPGCM
5.
文字图像处理之视觉蕴涵
6.
【计算机视觉】图像检索
7.
跨模态检索
8.
跨模态检索:带你领略图文检索的魅力
9.
【天然语言处理】--视觉问答(Visual Question Answering,VQA)从初始到应用
10.
【自然语言处理】--视觉问答(Visual Question Answering,VQA)从初始到应用
>>更多相关文章<<