请帮助理解random.choices（）权重

import random k = 100 population = random.choices( population=[['a'],['b'],['c'],['d'],['e'],['f'],['g'],['h'], ['i'],['j']], weights=[10, 10, 10, 10, 10, 10, 10, 10, 10, 10], k=k) print(population.count(['a'])/k, population.count(['b'])/k, population.count(['c'])/k, population.count(['d'])/k, population.count(['e'])/k, population.count(['f'])/k, population.count(['g'])/k, population.count(['h'])/k, population.count(['i'])/k, population.count(['j'])/k)

1条回答

网友

1楼 · 发布于 2024-04-20 00:30:28

你对权重有正确的理解。我不确定您的问题到底是什么，也许您的代码在其他地方有错误。另一个可能的错误是random.choices使用替换从人群中进行采样。阅读文档here。这意味着您可以使用k=15进行采样，然后像3as和0bs那样拉出

这是我用来测试的代码，希望对您有用

import random
from collections import defaultdict
from pprint import pprint
random.seed(500)

d = defaultdict(int)
sum = 0
# Run this a bunch of times
for _ in range(100000):
    r = random.choices(
        population=[['a'],['b'],['c'],['d'],['e'],['f'],['g'],['h'], ['i'],['j']],
        weights=[10, 10, 10, 10, 10, 10, 10, 10, 10, 10],
        k=9)
    for ch in r:
        d[ch[0]] += 1
        sum += 1

for k, v in d.items():
    proportion = v/sum
    print(f'{k}: {proportion}')

输出

h: 0.10035777777777778
j: 0.10031111111111111
f: 0.10043333333333333
c: 0.09983555555555555
d: 0.09992888888888889
i: 0.0998
a: 0.10010222222222222
e: 0.09956555555555556
b: 0.10003222222222222
g: 0.09963333333333334

运行random.choices并替换k = 15的示例：

[['h'], ['j'], ['f'], ['c'], ['h'], ['d'], ['i'], ['d'], ['f'], ['h'], ['a'], ['d'], ['d'], ['c'], ['j']]

这完全是意料之中的事！如果你不明白这一点，再复习一下你的统计数据

编辑：根据你原来帖子上的评论，你应该重新审视一下抽样替换的分布情况。如果在100个样本中，各种字母的所有概率都收敛到10%，这将是非常令人惊讶的。我建议你买一个六面骰子，开始滚动，同时记录它落在什么数字上。根据你的样本，要想得到每一个有1/6几率的数字，需要掷几次骰子

相关问题更多 >

编程相关推荐

热门问题

热门文章