TensorFlow技术解析与实战 12 图像与语音的结合

时间 2020-12-30

原文原文链接

实现人工智能要有3个要素：语法、语义和推理语音和视觉是人工智能界非常关注的点，也就是说，在语言和视觉层面，通过语法（对语言来说是语法解析，对视觉来说是三维结构的解析）和语义（对语言来说是语义，对视觉来说是物体动作的含义）作为模型的输入训练数据，最终实现推理的能力，也就是把训练中学习到的能力应用到工作中去，从新的数据中推断出结论。 12.1 看图说话模型输入一张图片，希

>>阅读原文<<