在Python中生成分类数据集

3 投票
1 回答
2261 浏览
提问于 2025-04-17 21:06

假设我有一个包含十个城市的列表:

["paris", "barcelona", "kolkata", "new york"]

我该如何模拟n个随机数据集,每个数据集有两个属性,每个属性从上面的城市列表中随机选择两个城市呢:

["paris", "barcelona"]
["barcelona", "kolata"]
["new york", "paris"]
["paris", "barcelona"]
["new york", "paris"]

1 个回答

5

你可以这样使用 random.sample 方法

data = ["paris", "barcelona", "kolkata", "new york"]
import random
print [random.sample(data, 2) for _ in xrange(5)]

撰写回答