2024-05-13 17:29:45 发布
网友
我一直在阅读有关如何将矢量化环境与subcvenv模块一起使用的内容 来自here和 here
然而,我能找到的所有示例都使用稳定的基线(openai的模型),我似乎找不到一种方法来使用我的自定义模型
能做到吗?怎么会这样
可以按照Colab笔记本中的说明进行操作。我不确定你面临什么问题。我为自定义环境实现的方式是:
# Instantiate the env env = customEnv() # Wrap it env = DummyVecEnv([lambda: env]) EPISODES = 5000 # Instantiate and learn using stable-baselines model = PPO2('MlpPolicy', env).learn(EPISODES)
我相信你也可以为SubProcVenv做同样的事情。如果要使用多处理,请仅选择SubProcVenv
SubProcVenv
可以按照Colab笔记本中的说明进行操作。我不确定你面临什么问题。我为自定义环境实现的方式是:
我相信你也可以为
SubProcVenv
做同样的事情。如果要使用多处理,请仅选择SubProcVenv
相关问题 更多 >
编程相关推荐