未提供项目说明

gdmix-trainer的Python项目详细描述


GDMix公司

这是什么

广义DeepMixed Model(GDMix)是一个训练非线性固定效应和随机效应模型的框架。这类模型在个性化搜索推荐系统中得到了广泛的应用。这个项目是我们早期在广义线性模型Photon ML上所做努力的延伸。它在Tensorflow、Scipy和Spark中实现。在

当前版本的GDMix支持logistic回归和固定效应的DeText模型,然后支持随机效应的logistic回归。在未来,如果相关度量的改进可以证明复杂性的增加,我们可能会支持随机效应的深层模型。在

支持的模型

逻辑回归

logistic回归作为一种基本的分类模型,由于其模型简单、训练效率高,在搜索推荐系统中得到了广泛的应用。我们的实现使用Tensorflow进行数据读取和梯度计算,并使用Scipy的L-BFGS解算器。这种组合利用了张量流的多功能性和L-BFGS的快速收敛性。这种模式在功能上等同于光子ML,但效率有所提高。我们的内部测试显示,在各种数据集上,训练速度提高了10%到40%。在

DeText模型

DeText是一个以文本特征为重点的排名框架。GDMix将DeText培训作为一个全球模型在本地提供支持。用户可以将固定效果模型类型指定为DeText,然后提供网络规格。GDMix将自动训练和评分,并将模型连接到后续的随机效应模型。目前,只有DeText的点态损失函数才被允许与logistic回归随机效应模型相联系。在

其他型号

GDMix可以与任何深入学习的固定效应模型一起工作。GDMix与其他模型的接口在文件I/O处,用户可以在GDMix外部训练一个模型,然后用该模型对训练数据进行评分,并将得分保存在文件中,作为GDMix随机效应训练的输入。这使得用户能够根据GDMix本身不支持的自定义固定效应模型的分数来训练随机效应模型。在

培训效率

对于logistic回归模型,通过并行训练来提高训练效率。由于固定效应模型通常需要对大量的数据进行训练,因此采用了基于张量流全归约运算的同步训练。每个工人取一部分训练数据,计算局部梯度。梯度被聚集,然后输入到L-BFGS解算器。每个随机效应模型的训练数据集通常很小,但是模型的数量(例如所有LinkedIn成员的单个模型)可能在数亿个左右。这需要一个划分和并行的培训策略,每个工人负责一部分人口,所有工人独立地同时训练他们指定的模型。在

对于DeText模型,无论是基于Tensorflow的参数服务器异步分布式训练,还是基于Horovod的同步分布式训练,都可以提高效率。在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
爪哇太阳报。安全验证器。ValidatorException:PKIX路径生成失败   java理解为什么在onDispatchTouchEvent()返回True后仍调用onClick()   java如何在资源包中使用JSF标记/如何在资源包中重写URL?   java什么是流控制异常的替代方案?   java使用Spring数据JPA/MongoDB交叉存储,一个查询可以跨越两个数据库吗?   Apache Sling/felix中的java OSGi slf4j日志记录   为什么当我们想要水平/垂直旋转矩阵时,我们要把这个项除以2?   尝试从外部网页接收JSON字符串时出现安卓 Java NullPointerException   java执行异常:从Callable调用方法时   java在jetty上以调试模式运行webapp,使用maven jetty插件在intellij中构建成功(应用程序应在调试模式下启动)   带有内存数据库的linux Java应用程序的构建时间太长   基于java的随机数单元测试算法   java类型javax。摆动JComponent无法解析   Google日历API和UI小部件Java   java tomcat没有突然和任意地响应   java无法使用jsoup在html中获取图像src   我无法让Java接受键盘输入字符串   java如何开始使用Bambol而不让部署永远继续?   java如何使用另一个类的actionPerformed方法删除一个类/组件中的按钮?   java JSON反序列化brakets{}中的一系列对象