如何利用Keras最大化函数 - 问答 - Python中文网

如何利用Keras最大化函数

2024-06-16 11:13:57 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我正在尝试用Keras实现Deep Deterministic Policy Gradient。你知道吗

算法如下：

问题是第14步。你知道吗

这里我们有两个模型：演员π和评论家Q。其目的是修改π的参数，使Q（s，π（s））最大化。由于没有目标值，不可能使用Keras损失。你知道吗

所以，问题是：有没有可能使用Keras优化器来最大化函数Q（s，π（s））？ [更一般地说：是否有可能优化函数f（π（s））？]你知道吗

还要注意，Q也是一个模型，因此在优化中必须指定所考虑的参数是π的参数。你知道吗

Tags：函数模型目的算法参数 policy algorithm keras

0条回答

目前没有回答

相关问题更多 >

编程相关推荐

热门问题

热门文章