ml-agent v0.3 win10安装和实践 ML-Agent：经过TF#使用训练完成的模型数据

时间 2019-12-09

标签 agent v0.3 win10 win 安装实践经过使用训练完成模型数据栏目 Windows 繁體版

原文原文链接

前言

近段时间，ml-agent升级到了v0.3版本，作了一些变动，致使以前的文档《ml-agent v0.2：Win10下环境安装》部份内容没法在ml-agent v0.3中使用。最主要的是ppo.ipynb文件移除，致使没法用ppo.ipynb进行训练。因此这里进行从新整理。php

参考文档

软件安装

一、克隆ml-agent

从Github网站上https://github.com/Unity-Technologies/ml-agents克隆（下载）ml-agent，代码，放在任意位置下。(本文放在D:\ml-agent)html

二、安装Visual Studio/Unity3d

安装略过python

三、安装Anaconda 64位

Anaconda内置了Phython3 64位和Jupyter notebook以及其余便利的功能，因此仍是选择安装Anaconda简化整个Phython的过程。下载地址https://www.anaconda.com/download/#windows。安装略过（本文安装在F盘）。安装完成后利用Anaconda的Anaconda Navigator建立一个环境(这里环境名为tensorflow)，Phython版本选择3.6。git

四、安装ml-agent依赖库

在开始菜单中打开Anacoda Prompt，在命令行中输入一下命令来激活刚刚建立的环境github

activate tensorflow算法

输入命令切换到ml-agent所在的目录中python目录的位置。好比ml-agent安装目录为D:\Git\ml-agent，则输入windows

cd D:\Git\ml-agent\pythonapp

若是你的Anaconda不是安装在ml-agent目录相同的磁盘，那么须要切换到ml-agen所在的磁盘。好比这里Anaconda的安装目录为F盘，ml-agent安装目录为D:\ml-agent，则须要切换到D盘，输入post

D:网站

而后开始安装Demo所需的环境，输入命令

pip install .

注意，不要遗漏最后的点号。等待安装完成便可。该命令会安装全部的依赖库，包括tensorflow。此时不用关闭这个窗口。

五、编译Unity程序

使用Unity2017打开ml-agent下unity-environment文件夹。

打开Assets\ML-Agents\Examples\3DBall目录下的3DBall场景文件。在场景中选择Ball3DAcademy下的Ball3DBrain物体，将TypeOfBrain修改成External，表示从Tensorflow中获取数据。

菜单中选择File->Build Setting，添加当前所在场景。（能够勾选Development Build以便查看输出）

点击PlayerSeting，检查设置

Resolution and Presentation -> 勾选Run in Background

Resolution and Presentation -> Display Resolution Dialog设置为disable

回到Build Setting面板，点击Build，编译到ml-agent的python目录中。名为3dball.exe

六、开始训练

注意，训练方法和ml-agent v0.2不一样。v0.2使用Jupyter notebook运行ppo.ipynb文件。可是v0.3改成使用命令行的方法。

咱们回到Anacoda Prompt，输入如下命令：

python learn.py 3dball --run-id=test --train

其中

learn.py包含了大量的ml算法，包括ppo。
3dball就是刚刚咱们用unity生成的exe文件的名称。
--run-id=test能够不写，只是声明此次训练的id。好比能够用tensorboard来看
--train表示声明执行的是训练模式

若是这这些命令参数感兴趣，请参考Training ML-Agents

因为训练的Step为5.0e4(5*10的4次方)，若是用cpu算比较慢，能够暂时修改超参数配置文件trainer_config.yaml，将Ball3DBrain下增长一行max_steps: 2.0e4（注意，因为该文件采用yaml格式，对文件的编码格式和空格要求很是严格，若是异常，将没法进行训练。max前面有4个空格，不是tab。冒号后面有一个空格，整个文件采用UTF8编码）。

训练结果数据保存在models\test\下，使用bytes文件请参考ML-Agent：经过TF#使用训练完成的模型数据

训练的结果视频：Unity ml-agent v0.3实践