我有数据帧user_recommended
,如图所示。recommendations
列是PySpark RDD,如下所示:
In[10]: user_recommended.recommendations[0]
Out[10]: [Row(item=0, rating=0.005226806737482548),
Row(item=23, rating=0.0044402251951396465),
Row(item=4, rating=0.004139747936278582)]
我想把recommendations
RDD转换成Python列表。你知道吗
有没有一个脚本可以帮助我将user_recommended
数据帧中的recommendations
列(注意它的类型是pandas.core.frame.DataFrame
)转换为列表。你知道吗
我想你想这么做
另一种稍有不同的方法。在我看来,这样做的价值在于,它可以更容易地推广到
Rows
包含2个以上的元素。另外,值得注意的是,您在问题中预览的数据结构是一个包含PySparkRow
数据结构列表的列,实际上不是RDD。你知道吗相关问题 更多 >
编程相关推荐