开放式人工智能健身房强化学习环境推荐
recogym的Python项目详细描述
重新健身
Recsys 2018的Python代码揭示了题为“Recogym:在线广告中产品推荐问题的强化学习环境”的研讨会论文。打印前版本的纸张可以在这里找到-https://arxiv.org/abs/1808.00720
recogym是一个开放的ai-gym-rl推荐环境,它由电子商务上的用户流量模式模型和发布者网站上的用户对推荐的响应定义。我们希望recogym将是推荐系统研究领域向前迈出的重要一步,这将开辟推荐系统和强化学习社区之间的合作渠道,并导致离线和在线性能指标之间更好的一致性。
要开始使用recogym请查看“入门”jupyter笔记本,该笔记本将解释环境的功能并详细介绍创建简单代理的过程。“比较代理”笔记本会比较我们所选代理的推荐性能。我们在recogym中包含的代理可以在这个存储库的agents目录中找到。
依赖关系和要求
该代码的设计仅支持Python3.7+。项目具有以下依赖项和版本要求:
- 笔记本电脑=5.6.0+
- matplotlib=2.2.3+
- numpy=1.15.1+
- python=3.7.1+
- 熊猫=0.23.4+
- scipy=1.1.0+
- Pythorch=1.0+
- rpy2=2.9.1+
- SCIKIT学习=0.20.1+
在这个存储库中,我们提供了一个anaconda环境设置文件,其中包含所有必需的python包和版本,这些包和版本都已配置好。您可以如下安装:
# install conda env conda install -c conda conda-env conda install -c r r-essentials # create environment based on environment.yml conda-env create environment.yml # conda support is missing, use pipinstead pip install gym
引用
如果您使用此代码,请引用此工作的相关论文:
@article{rohde2018recogym,
title={RecoGym: A Reinforcement Learning Environment for the problem of Product Recommendation in Online Advertising},
author={Rohde, David and Bonner, Stephen and Dunlop, Travis and Vasile, Flavian and Karatzoglou, Alexandros},
journal={arXiv preprint arXiv:1808.00720},
year={2018}
}
许可证
版权所有criteo
根据apache许可证2.0版(以下简称“许可证”)授权;除非符合许可证,否则您不能使用此文件。您可以在http://www.apache.org/licenses/LICENSE-2.0
除非适用法律要求或书面同意,否则根据许可证分发的软件按“原样”分发,无任何明示或默示的保证或条件。 请参阅许可证,以了解控制许可证下权限和限制的特定语言。