面向结构化数据推荐的Python深度强化学习工具包。

RL-for-reco的Python项目详细描述


#深度结构化业务学习强化 -在

项目记录 -在

一个向客户推荐产品的类,其中包括客户的当前信息和产品推荐历史记录。 类变量项表示产品及其关联促销、优惠等任何推荐类型。 如果你想要一个客户没有推荐的案例,你可以用“无”来代表这个案例。 状态、行为和奖励分别是n维数组、一维数组和浮点数。 过渡模型state+action=>;(state,reward)假设为TorchModel上的多输出神经网络。在

这个框架实际上适用于任何结构化数据的问题。在

网络记录 -在

通过普通网络更新Q值的类。 这也是对任何问题都适用的一般形式。在

学习 -在

描述一个深度Q学习问题(环境、代理及其策略和相关参数)并通过深度Q网络及其逼近器学习代理的类。在

火炬模型 -在

几个类用pyTorch建立神经网络。在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何将HashMap<String,Object>从一个活动传递到另一个活动   java如何手动加密socket连接的流量?   java正则表达式生成一个不正确的结果   Java方法引用具有泛型参数的方法   java app setBackground()错误:不兼容的类型:int无法转换为Drawable   java是启动Spring引导而不是SpringApplication的其他方法。跑   无法打开java类路径资源[org/quartz/impl/jdbcjobstore/tables_h2.sql],因为它不存在   spring使用Java,如何确定来自tomcat Web服务器的出站服务调用?   java获取多个同名的XML元素JAXB   java使用Ant从同一代码库构建Swing和Android应用程序   JComponent的java重绘方法不起作用   java目标不可访问,标识符“beanName”解析为null   smtp是否有支持esmtp管道的java api?   java如何在Spring中自动连接业务对象   java在Hibernate中没有其他保存实体的方法吗?   针对两个客户机的SpringJavaWeb应用程序项目开发   使用split的java标记化输入