倒坡率我试图将BoundingLayer函数从this file移植到DDPG.py代理在keras-rl中,但我在实现时遇到一些问题。在 我在中修改了get_gradients(loss, params) ...2024-05-23 已阅读: n次
统一传销代理运行非常缓慢使用pythonapi,无论是使用构建还是在编辑器中运行,模拟都比使用提供的mlagents-learn方法慢得多。我运行的是类似于this,使用的是DDPG和cuda9.0的PyTorch实现。这是 ...2024-05-23 已阅读: n次
在多任务处理中,反向传播后无法创建新的计算图背景:我使用DQN和DDPG同时解决两个任务。DQN和DDPG的state(input)都是两部分。一部分是环境状态,另一部分是CNN+LSTM从环境中提取的状态。这两个部分分别在forward_dq ...2024-05-23 已阅读: n次
如何利用Keras最大化函数我正在尝试用Keras实现Deep Deterministic Policy Gradient。你知道吗 算法如下: DDPG algorithm 问题是第14步。你知道吗 这里我们有两个模型:演员π ...2024-05-23 已阅读: n次
A3C能否申请培训TD3?如何使用异步RL框架(如A3C)来训练DDPG或TD3 我尝试将每个参与者学习者作为DDPG代理,并异步更新全局DDPG代理,但没有成功 ...2024-05-23 已阅读: n次
需要使用tfagents Ddpgagent的完整示例吗我在TensorFlow中的tf agents中找不到任何使用DDPGAgents的完整示例,也无法使其发挥作用。请有人链接一段完整的代码或完整的教程,创建并培训ddpg代理和数据规范 ...2024-05-23 已阅读: n次
Pytorch在训练时减速我正在训练一个演员-评论家强化学习算法,像DDPG,很多集。然而,每一步的时间开始增加,然后保持在一个稳定的水平上,如下图所示 我首先认为我忘记了.detach()/.item()元素,我把它放在r ...2024-05-23 已阅读: n次
错误:`callbacks`必须是返回DefaultCallbacks子类的可调用方法,get<class'ray.rllib.agents.callbacks.DefaultCallbacks'>当我运行一些代码(DDPG-Deep Deterministic Policy Gradient)时,出现了以下错误:ValueError:callbacks必须是一个可调用的方法,该方法返回Defa ...2024-05-23 已阅读: n次
ImportError:无法导入名称“RolloutWorker”(ray.rllib)我想导入ray.rllib中的一个代理,“ddpg”,但出现了一些错误 有人能帮我吗 我使用谷歌colab ...2024-05-23 已阅读: n次
如何在中指定检查点目录ray.tune.run_实验在ray.tune.run_实验检查点模型在某个路径上,如“/ray_results/test/DDPG_VAV-v0_0_2019-04-17_21-43-43ak0121vf/”,它太长了,如何更 ...2024-05-23 已阅读: n次
带负值的OpenAiGym离散空间我已经创建了一个定制的健身房环境,其中的动作可以是-100到+100之间的任意整数。据我所知,不可能创建一个允许负值的离散空间,我提供的唯一解决方案是创建一个从-100到+100的长方体空间(注意这是 ...2024-05-23 已阅读: n次
为什么actor中的可训练变量没有梯度?我自己在tensorflow中实现了ddpg,遇到了一个神秘的bug,花了我好几天的时间去思考,但仍然没有结果。你知道吗 我把演员的损失定义为 actor_loss = - tf.reduce_mea ...2024-05-23 已阅读: n次
pytorch-policPythorch中的深度强化学习 这个存储库包含pytorch中所有标准的无模型和基于模型(coming)的rl算法。(可能还包含我目前正在研究的一些研 ...2024-05-23 已阅读: n次
NeodroidAgent 代理 此存储库将承载应用Neodroid平台的所有初始机器学习工作。 Neodroid是在挪威研究理事会262900资助下开发的。(https://www.forskningsradet.no/p ...2024-05-23 已阅读: n次
ddpg-agent#DDPG U代理 使用深度确定性策略梯度(ddpg)的强化学习代理。 该强化学习模型是[udacity的ddpg模型](https://github.com/udacity/deep-reinfor ...2024-05-23 已阅读: n次