学习强化学习
lrl的Python项目详细描述
lrl:学习强化学习
有关完整文档,请参见here。
概述
lrl是一个用于应用的python包(希望是学习!)基本强化学习算法。对于试图理解规划和学习的基本概念的人来说,它是一个早期的踏脚石,以一种文档化、可读性和可理解的方式提供一些简单环境和算法的开箱即用的实现,从而为人们提供一个建立理解的平台。
作者编写这个包的总体目标是为那些对强化学习感兴趣的人提供一个起点和扶手,帮助他们开始学习。在这里,最快、最有效的实现比不上代码更重要,因为代码可以由新接触该主题并具有中级python技能的人阅读和学习。
这个包背后的想法源于支持学生完成乔治亚理工大学OMSCS课程CS 7641:机器学习的材料。CS 7641采取自上而下的方法来学习机器学习,鼓励学生找到现有的算法实现的讨论,并应用它们来获得他们的整体性能和缺陷的感觉。虽然用于监督学习的python实现有很好的表现(scikit-learn)和用于随机优化和搜索的学生驱动项目(mlrose)可用,但是用于简单强化学习的健壮且注释良好的实现并不常见。这个包裹试图填补这一空白。
安装说明
使用pip可以访问lrl
pip install lrl
或者,您可以将源文件拉到工作目录,以便在家中继续播放
git clone https://github.com/ca-scribner/lrl.git lrl
pip install -e lrl