我在一个有两列mvv和count的数据帧上工作。
+---+-----+
|mvv|count|
+---+-----+
| 1 | 5 |
| 2 | 9 |
| 3 | 3 |
| 4 | 1 |
我想获得包含mvv值和count值的两个列表。有点像
mvv = [1,2,3,4]
count = [5,9,3,1]
所以,我尝试了以下代码:第一行应该返回一个python行列表。我想看看第一个价值:
mvv_list = mvv_count_df.select('mvv').collect()
firstvalue = mvv_list[0].getInt(0)
但是第二行出现了一条错误消息:
AttributeError: getInt
这将把所有元素作为一个列表提供给您。
你看,为什么你这样做是行不通的。首先,您试图从Row类型中获取整数,您的collect的输出如下:
如果你吃了这样的东西:
您将得到
mvv
值。如果需要数组的所有信息,可以采用以下方法:但如果你在另一个专栏中尝试同样的方法,你会得到:
这是因为
count
是一个内置方法。该列与count
同名。解决方法是将count
的列名更改为_count
:但不需要这种解决方法,因为您可以使用字典语法访问列:
最终会成功的!
下面一行给出了您想要的列表。
相关问题 更多 >
编程相关推荐