如何利用Keras最大化函数

2024-06-16 11:13:57 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试用Keras实现Deep Deterministic Policy Gradient。你知道吗

算法如下:

DDPG algorithm

问题是第14步。你知道吗

这里我们有两个模型:演员π和评论家Q。 其目的是修改π的参数,使Q(s,π(s))最大化。由于没有目标值,不可能使用Keras损失。你知道吗

所以,问题是:有没有可能使用Keras优化器来最大化函数Q(s,π(s))? [更一般地说:是否有可能优化函数f(π(s))?]你知道吗

还要注意,Q也是一个模型,因此在优化中必须指定所考虑的参数是π的参数。你知道吗


Tags: 函数模型目的算法参数policyalgorithmkeras