迭代多臂bandit实验的贝叶斯优化。
dillinger的Python项目详细描述
#Dillinger:致命精确的多武装匪徒
Dillinger是使用贝叶斯优化为多武装匪徒选择新行动的指南。该项目的核心是一个**高斯过程**类,它可以适应多武装匪徒的观测。为了便于演示,该软件包还具有以下特点:基于价格敏感曲线模拟客户LTV的数据生成器,以及SOFTMax BANDIT算法的实现。
BR/>此项目仍在建设中,因为我正在修改现有项目以使其更易于使用和可访问。对于那些有兴趣将贝叶斯优化应用到a/b测试或多臂bandit实验的人来说。
有关如何使用此软件包的示例,请参见“演示”。
Dillinger是使用贝叶斯优化为多武装匪徒选择新行动的指南。该项目的核心是一个**高斯过程**类,它可以适应多武装匪徒的观测。为了便于演示,该软件包还具有以下特点:基于价格敏感曲线模拟客户LTV的数据生成器,以及SOFTMax BANDIT算法的实现。
BR/>此项目仍在建设中,因为我正在修改现有项目以使其更易于使用和可访问。对于那些有兴趣将贝叶斯优化应用到a/b测试或多臂bandit实验的人来说。
有关如何使用此软件包的示例,请参见“演示”。