data_list = ["abc", "xyz", "pqr"]
from pyspark.sql.functions import *
spark.createDataFrame([(k,) for k in data_list]).orderBy(rand()).limit(1).show()
#+ -+
#| _1|
#+ -+
#|pqr|
#+ -+
spark.createDataFrame([(k,) for k in data_list]).orderBy(rand()).limit(1).show()
#+ -+
#| _1|
#+ -+
#|xyz|
#+ -+
#to get string
spark.createDataFrame([(k,) for k in data_list]).orderBy(rand()).limit(1).rdd.map(lambda x:x['_1']).collect()[0]
#u'abc'
您可以从列表中创建数据帧,然后使用rand函数从列表中生成随机数据
Example:
相关问题 更多 >
编程相关推荐