TensorFlow技术解析与实战 12 图像与语音的结合

    实现人工智能要有3个要素:语法、语义和推理     语音和视觉是人工智能界非常关注的点,也就是说,在语言和视觉层面,通过语法(对语言来说是语法解析,对视觉来说是三维结构的解析)和语义(对语言来说是语义,对视觉来说是物体动作的含义)作为模型的输入训练数据,最终实现推理的能力,也就是把训练中学习到的能力应用到工作中去,从新的数据中推断出结论。 12.1 看图说话模型      输入一张图片,希
相关文章
相关标签/搜索