在Python中生成分类数据集
假设我有一个包含十个城市的列表:
["paris", "barcelona", "kolkata", "new york"]
我该如何模拟n个随机数据集,每个数据集有两个属性,每个属性从上面的城市列表中随机选择两个城市呢:
["paris", "barcelona"]
["barcelona", "kolata"]
["new york", "paris"]
["paris", "barcelona"]
["new york", "paris"]
1 个回答
5
你可以这样使用 random.sample
方法
data = ["paris", "barcelona", "kolkata", "new york"]
import random
print [random.sample(data, 2) for _ in xrange(5)]