开放式人工智能健身房中的随机播种

2024-06-16 10:15:34 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个关于在开放人工智能健身房播种和在定制环境中使用它的问题。 以lunar lander environment为例,默认的种子设定函数是:

def seed(self, seed=None):
    self.np_random, seed = seeding.np_random(seed)
    return [seed]

生成时使用:

height = self.np_random.uniform(0, H/2, size=(CHUNKS+1,) )

我的问题是,如果我创建一个自定义环境并使用numpy或sci stats,我需要使用np.random.seed()来获得效果。我应该如何使用self.np_random.在自定义环境中播种?如果我使用np.random.uniform(0,0.02)?我应该改用self.np_random.uniform(0,0.02)吗?sci数据呢?如果我使用scipy.stats.truncnorm.rvs(),我应该如何在那里使用它?如果我只设置np.random.seed(seed),有什么后果吗?你知道吗

我现在正在使用此解决方法:Can I create a local numpy random seed?

有更好的解决办法吗?你知道吗


Tags: selfnumpyenvironment环境statsnprandomuniform