学习强化学习

lrl的Python项目详细描述


lrl:学习强化学习

有关完整文档,请参见here

概述

lrl是一个用于应用的python包(希望是学习!)基本强化学习算法。对于试图理解规划和学习的基本概念的人来说,它是一个早期的踏脚石,以一种文档化、可读性和可理解的方式提供一些简单环境和算法的开箱即用的实现,从而为人们提供一个建立理解的平台。

作者编写这个包的总体目标是为那些对强化学习感兴趣的人提供一个起点和扶手,帮助他们开始学习。在这里,最快、最有效的实现比不上代码更重要,因为代码可以由新接触该主题并具有中级python技能的人阅读和学习。

这个包背后的想法源于支持学生完成乔治亚理工大学OMSCS课程CS 7641:机器学习的材料。CS 7641采取自上而下的方法来学习机器学习,鼓励学生找到现有的算法实现的讨论,并应用它们来获得他们的整体性能和缺陷的感觉。虽然用于监督学习的python实现有很好的表现(scikit-learn)和用于随机优化和搜索的学生驱动项目(mlrose)可用,但是用于简单强化学习的健壮且注释良好的实现并不常见。这个包裹试图填补这一空白。

安装说明

使用pip可以访问lrl

pip install lrl

或者,您可以将源文件拉到工作目录,以便在家中继续播放

git clone https://github.com/ca-scribner/lrl.git lrl
pip install -e lrl

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java检查整数是0还是检查变量是null更好?   java Android Kotlin(初学者)使用File(),并从ACTION\u GET\u内容返回Uri   java JavaFx在“内部场景”和根场景之间切换   spring将XMLBean配置转换为java配置   java JPA HIBERNATE映射列两次(embeddedID和POJO)   c#单态模式模型在什么情况下适用?   java请求。getRemoteUser在特定时间后返回null?   spring boot中PUT api控制器的java my单元测试用例失败   java在字符串中互换地解析和替换值   java Android JNI在应用程序中检测到错误:调用JNI GetMethodID时出现挂起异常   JavaSpringDataMongo:使用非简单键持久化映射   爪哇玻璃鱼连接被拒绝   java如何在用户注册时发送特定电子邮件id的自动回复?   Java列表:实例化时和之后的赋值之间的差异