Python ddpg_专题 - Python中文网

当前热门话题： Python ddpg: 本站为您提供最新、最全的ddpg的Python教程、文档、代码、资源等相关内容，Python中文网技术交流社区同时还提供学习资源下载，如：电子书、IDE编辑器软件、编程视频、代码规范标准、WEB开发、GUI、科学计算与人工智能等相关内容。

本文网址：https://www.cnpython.com/tags/310818
欢迎加入QQ群-->： 979659372

关于ddpg 相关联的Python项目和问题：

倒坡率

我试图将BoundingLayer函数从this file移植到DDPG.py代理在keras-rl中，但我在实现时遇到一些问题。在我在中修改了get_gradients(loss, params) ...

2024-05-23 已阅读: n次

统一传销代理运行非常缓慢

使用pythonapi，无论是使用构建还是在编辑器中运行，模拟都比使用提供的mlagents-learn方法慢得多。我运行的是类似于this，使用的是DDPG和cuda9.0的PyTorch实现。这是 ...

2024-05-23 已阅读: n次

在多任务处理中，反向传播后无法创建新的计算图

背景：我使用DQN和DDPG同时解决两个任务。DQN和DDPG的state(input)都是两部分。一部分是环境状态，另一部分是CNN+LSTM从环境中提取的状态。这两个部分分别在forward_dq ...

2024-05-23 已阅读: n次

如何利用Keras最大化函数

我正在尝试用Keras实现Deep Deterministic Policy Gradient。你知道吗算法如下： DDPG algorithm 问题是第14步。你知道吗这里我们有两个模型：演员π ...

2024-05-23 已阅读: n次

A3C能否申请培训TD3？

如何使用异步RL框架（如A3C）来训练DDPG或TD3 我尝试将每个参与者学习者作为DDPG代理，并异步更新全局DDPG代理，但没有成功 ...

2024-05-23 已阅读: n次

需要使用tfagents Ddpgagent的完整示例吗

我在TensorFlow中的tf agents中找不到任何使用DDPGAgents的完整示例，也无法使其发挥作用。请有人链接一段完整的代码或完整的教程，创建并培训ddpg代理和数据规范 ...

2024-05-23 已阅读: n次

Pytorch在训练时减速

我正在训练一个演员-评论家强化学习算法，像DDPG，很多集。然而，每一步的时间开始增加，然后保持在一个稳定的水平上，如下图所示我首先认为我忘记了.detach（）/.item（）元素，我把它放在r ...

2024-05-23 已阅读: n次

错误：`callbacks`必须是返回DefaultCallbacks子类的可调用方法，get<class'ray.rllib.agents.callbacks.DefaultCallbacks'>

当我运行一些代码（DDPG-Deep Deterministic Policy Gradient）时，出现了以下错误：ValueError:callbacks必须是一个可调用的方法，该方法返回Defa ...

2024-05-23 已阅读: n次

ImportError:无法导入名称“RolloutWorker”（ray.rllib）

我想导入ray.rllib中的一个代理，“ddpg”，但出现了一些错误有人能帮我吗我使用谷歌colab ...

2024-05-23 已阅读: n次

如何在中指定检查点目录ray.tune.run_实验

在ray.tune.run_实验检查点模型在某个路径上，如“/ray_results/test/DDPG_VAV-v0_0_2019-04-17_21-43-43ak0121vf/”，它太长了，如何更 ...

2024-05-23 已阅读: n次

带负值的OpenAiGym离散空间

我已经创建了一个定制的健身房环境，其中的动作可以是-100到+100之间的任意整数。据我所知，不可能创建一个允许负值的离散空间，我提供的唯一解决方案是创建一个从-100到+100的长方体空间（注意这是 ...

2024-05-23 已阅读: n次

为什么actor中的可训练变量没有梯度？

我自己在tensorflow中实现了ddpg，遇到了一个神秘的bug，花了我好几天的时间去思考，但仍然没有结果。你知道吗我把演员的损失定义为 actor_loss = - tf.reduce_mea ...

2024-05-23 已阅读: n次

pytorch-polic

Pythorch中的深度强化学习这个存储库包含pytorch中所有标准的无模型和基于模型（coming）的rl算法。（可能还包含我目前正在研究的一些研 ...

2024-05-23 已阅读: n次

ddpg

ddpg算法的tensorflow实现此包Python名称：ddpg 目前版本： ddpg 0.2.0 最后维护时间：Jul 19 ...

2024-05-23 已阅读: n次

NeodroidAgent

代理此存储库将承载应用Neodroid平台的所有初始机器学习工作。 Neodroid是在挪威研究理事会262900资助下开发的。（https://www.forskningsradet.no/p ...

2024-05-23 已阅读: n次

ddpg-agent

#DDPG U代理使用深度确定性策略梯度（ddpg）的强化学习代理。该强化学习模型是[udacity的ddpg模型]（https://github.com/udacity/deep-reinfor ...

2024-05-23 已阅读: n次