蟒蛇城的贝氏强盗。
pybayesbandit的Python项目详细描述
3. BR/>>BR/>>BP/B> > PIP安装PyBaySeBiDe> BR/>< BR/>使用< BR/>< BR/> $PayBaysBeTeDe-帮助< BR/>用法:PyBaysBeNeDe[-PARAM[PARAMS.] ] [-D Max SHIV] [BR/> [-C-C] [-E情节] [-HR地平线] [-Prim] Python中的贝叶斯匪徒[-v]
{random,ucb,thompson,vi,uct,rollout,aotree}{bernoulli}
{total,simple}
python3中的bayesian bandits。
{random,ucb,thompson,vi,uct,rollout,aotree}
学习者类型
{bernoulli}bandit类型
{total,simple}游戏设置< < > >可选参数:< - H -,-帮助显示这个帮助消息,并退出“……”……………………………参数…(默认值=10)
-t试验,--试验
蒙特卡洛抽样试验次数(默认值=30)
-c uct探索常数(默认值=2.0)
-e集,--集集
模拟集数(默认值=200)
-hr水平,--地平线
每集的时间步数(默认值=100)
--情节情节累积遗憾
-v,--冗长冗长模式
````
>;learner=UCB
>;bandit=bernoulli([0.5,0.8,0.3])
>;集=100
>;地平线=50
在0.257秒内完成。
遗憾=7.6530±1.7081
````
```文本
$pybayesbandit-thompson-bernoulli总计-p 0.5 0.8 0.3-e 100-hr 50-v
在0.297秒内完成50
0.297秒内完成50
>结果:
>;奖励=35.2200±3.8822
>;遗憾=4.4560±2.6086
````
`````````````````文本
$Pybayesbandit Uct Bernoulli Total-P 0.5 0.8 0.3-E 100-HR 50--试验15--最大深度5-V
>运行Pybayesbandit的Pybayesbandit……
>;奖励=35.2200±3.2200±3.2200
``学习者=UCT(试验=15,最大深度=5,c=2.0)
>;bandit=bernouli([0.5,0.8,0.3])
>;集=100
>;地平线=50
在7.066秒内完成。
遗憾=3.4360±4.5856
```
许可证的第3版,或(在BR/>您的选项)任何以后的版本。
BR/> PayBaysButDIT被分发以希望它是有用的,但是
没有任何保证;甚至没有隐含的保证BR/>适销性或适合特定用途。有关详细信息,请参阅gnu less
通用公共许可证。
您应该已经收到gnu less通用公共许可证的副本
以及pybayesbandit。如果没有,请参阅http://www.gnu.org/licenses/。
{random,ucb,thompson,vi,uct,rollout,aotree}{bernoulli}
{total,simple}
python3中的bayesian bandits。
{random,ucb,thompson,vi,uct,rollout,aotree}
学习者类型
{bernoulli}bandit类型
{total,simple}游戏设置< < > >可选参数:< - H -,-帮助显示这个帮助消息,并退出“……”……………………………参数…(默认值=10)
-t试验,--试验
蒙特卡洛抽样试验次数(默认值=30)
-c uct探索常数(默认值=2.0)
-e集,--集集
模拟集数(默认值=200)
-hr水平,--地平线
每集的时间步数(默认值=100)
--情节情节累积遗憾
-v,--冗长冗长模式
````
>;learner=UCB
>;bandit=bernoulli([0.5,0.8,0.3])
>;集=100
>;地平线=50
在0.257秒内完成。
遗憾=7.6530±1.7081
````
```文本
$pybayesbandit-thompson-bernoulli总计-p 0.5 0.8 0.3-e 100-hr 50-v
在0.297秒内完成50
0.297秒内完成50
>结果:
>;奖励=35.2200±3.8822
>;遗憾=4.4560±2.6086
````
`````````````````文本
$Pybayesbandit Uct Bernoulli Total-P 0.5 0.8 0.3-E 100-HR 50--试验15--最大深度5-V
>运行Pybayesbandit的Pybayesbandit……
>;奖励=35.2200±3.2200±3.2200
``学习者=UCT(试验=15,最大深度=5,c=2.0)
>;bandit=bernouli([0.5,0.8,0.3])
>;集=100
>;地平线=50
在7.066秒内完成。
遗憾=3.4360±4.5856
```
许可证的第3版,或(在BR/>您的选项)任何以后的版本。
BR/> PayBaysButDIT被分发以希望它是有用的,但是
没有任何保证;甚至没有隐含的保证BR/>适销性或适合特定用途。有关详细信息,请参阅gnu less
通用公共许可证。
您应该已经收到gnu less通用公共许可证的副本
以及pybayesbandit。如果没有,请参阅http://www.gnu.org/licenses/。