教你用PyTorch实现“看图说话”(附代码、学习资源)

深度学习目前是一个很是活跃的领域---天天都会有许多应用出现。进一步学习Deep Learning最好的方法就是亲自动手。尽量多的接触项目而且尝试本身去作。这将会帮助你更深入地掌握各个主题,成为一名更好的Deep Learning实践者。python

这篇文章将和你们一块儿看一个有趣的多模态主题,咱们将结合图像和文本处理技术来构建一个有用的深度学习应用,即看图说话(Image Captioning)。看图说话是指从一个图像中基于其中的对象和动做生成文本描述的过程。例如:学习

1c2e99c2a37e49b28a7764a261eca806129fa141

这种过程在现实生活中有不少潜在的应用场景。一个明显的应用好比保存图片的描述字幕,以便该图片随后能够根据这个描述轻松地被检索出来。对象

咱们开始吧!blog

注意: 本文假定你了解深度学习的基础知识,之前曾使用CNN处理过图像问题。若是想复习这些概念,能够先阅读下面的文章:图片

d47e62d2b349aca45e42305ed6714efbe5ed61d9Fundamentals of Deep Learning – Starting with Artificial Neural Network
d47e62d2b349aca45e42305ed6714efbe5ed61d9Architecture of Convolutional Neural Networks (CNNs) demystified
d47e62d2b349aca45e42305ed6714efbe5ed61d9Tutorial: Optimizing Neural Networks using Keras (with Image recognition case study)
d47e62d2b349aca45e42305ed6714efbe5ed61d9Essentials of Deep Learning – Sequence to Sequence modelling with Attention (using python)ci

相关文章
相关标签/搜索