深度学习目前是一个很是活跃的领域---天天都会有许多应用出现。进一步学习Deep Learning最好的方法就是亲自动手。尽量多的接触项目而且尝试本身去作。这将会帮助你更深入地掌握各个主题,成为一名更好的Deep Learning实践者。python
这篇文章将和你们一块儿看一个有趣的多模态主题,咱们将结合图像和文本处理技术来构建一个有用的深度学习应用,即看图说话(Image Captioning)。看图说话是指从一个图像中基于其中的对象和动做生成文本描述的过程。例如:学习
这种过程在现实生活中有不少潜在的应用场景。一个明显的应用好比保存图片的描述字幕,以便该图片随后能够根据这个描述轻松地被检索出来。对象
咱们开始吧!blog
注意: 本文假定你了解深度学习的基础知识,之前曾使用CNN处理过图像问题。若是想复习这些概念,能够先阅读下面的文章:图片
Fundamentals of Deep Learning – Starting with Artificial Neural Network
Architecture of Convolutional Neural Networks (CNNs) demystified
Tutorial: Optimizing Neural Networks using Keras (with Image recognition case study)
Essentials of Deep Learning – Sequence to Sequence modelling with Attention (using python)ci