JavaShuo
栏目
标签
人工智能学习笔记9
时间 2020-12-23
标签
人工智能
深度学习
tensorflow
机器学习
强化学习
繁體版
原文
原文链接
Agent:智能体 策略网络(Policy Network): 直接预测在某个环境状态下应该采取的Action。 适合Action种类非常多或者有连续取值的Action的环境。(学习的不是某个action对应的期望价值Q,而是直接学习在当前环境应该采取的策略,可以直接产生最终的策略) 价值/估值网络(Value Network): 预测某个环境状态下所有A
>>阅读原文<<
相关文章
1.
Python人工智能学习笔记
2.
人工智能学习笔记——1
3.
人工智能,机器学习笔记
4.
人工智能学习笔记
5.
人工智能学习笔记7
6.
人工智能学习笔记6
7.
人工智能初步学习笔记
8.
人工智能学习笔记8
9.
人工智能和TensorFlow学习笔记
10.
人工智能简史—学习笔记
更多相关文章...
•
您已经学习了 XML Schema,下一步学习什么呢?
-
XML Schema 教程
•
我们已经学习了 SQL,下一步学习什么呢?
-
SQL 教程
•
Tomcat学习笔记(史上最全tomcat学习笔记)
•
适用于PHP初学者的学习线路和建议
相关标签/搜索
人工智能
学习笔记9
人工智能学习笔记
学习笔记
人工智能杂记
人工智能哲学
智能工厂
工业智能
Qt学习笔记
学习笔记——Linux
PHP教程
Thymeleaf 教程
PHP 7 新特性
学习路线
开发工具
初学者
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
.Net core webapi2.1生成exe可执行文件
2.
查看dll信息工具-oleview
3.
c++初学者
4.
VM下载及安装
5.
win10下如何安装.NetFrame框架
6.
WIN10 安装
7.
JAVA的环境配置
8.
idea全局配置maven
9.
vue项目启动
10.
SVN使用-Can't remove directoryXXXX,目录不是空的,项目报错,有红叉
本站公众号
欢迎关注本站公众号,获取更多信息
相关文章
1.
Python人工智能学习笔记
2.
人工智能学习笔记——1
3.
人工智能,机器学习笔记
4.
人工智能学习笔记
5.
人工智能学习笔记7
6.
人工智能学习笔记6
7.
人工智能初步学习笔记
8.
人工智能学习笔记8
9.
人工智能和TensorFlow学习笔记
10.
人工智能简史—学习笔记
>>更多相关文章<<