Python RL-for-reco包_程序模块 - PyPI

面向结构化数据推荐的Python深度强化学习工具包。

RL-for-reco的Python项目详细描述

#深度结构化业务学习强化 -在

项目记录 -在

一个向客户推荐产品的类，其中包括客户的当前信息和产品推荐历史记录。类变量项表示产品及其关联促销、优惠等任何推荐类型。如果你想要一个客户没有推荐的案例，你可以用“无”来代表这个案例。状态、行为和奖励分别是n维数组、一维数组和浮点数。过渡模型state+action=>；（state，reward）假设为TorchModel上的多输出神经网络。在

这个框架实际上适用于任何结构化数据的问题。在

网络记录 -在

通过普通网络更新Q值的类。这也是对任何问题都适用的一般形式。在

学习 -在

描述一个深度Q学习问题（环境、代理及其策略和相关参数）并通过深度Q网络及其逼近器学习代理的类。在

火炬模型 -在

几个类用pyTorch建立神经网络。在

欢迎加入QQ群-->： 979659372

RL-for-reco 1.0.27

RL-for-reco的Python项目详细描述

推荐PyPI第三方库

optic-document-flask

djcms-blog

bitclone

japanmap

virustotal2

pyair_utils

odoo10-addon-account-invoice-refund-link

django-url-simplif

wotwrapper

gitauthors

modoboa-postfix-autorepl

django-data-exporter

django-appmail

PyRook

autometric

导航栏

项目链接

标签

维护者

最新PyPI项目

最新Python常见问题

RL-for-reco 1.0.27

RL-for-reco的Python项目详细描述

推荐PyPI第三方库

optic-document-flask

djcms-blog

bitclone

japanmap

virustotal2

pyair_utils

odoo10-addon-account-invoice-refund-link

django-url-simplif

wotwrapper

gitauthors

modoboa-postfix-autorepl

django-data-exporter

django-appmail

PyRook

autometric

导 航 栏

项目 链接

标 签

维护者

最新PyPI项目

最新Python常见问题

导航栏

项目链接

标签