Python中文
首页
教程
问答
标签
搜索
登录
注册
pyspark apply函数在列上
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我想在dataframe列上运行一个自定义函数。列有一个长字符串,其中包含一些打开或单击的信息。路径列中的字符串格式如下所示:</p> <pre><code>+---------------------------------------------------------------+ | Path| +---------------------------------------------------------------+ |/utility/tracking/opened/50DD3254-BA1D-4D0B-ADB5-6529E9C90982/0| |/utility/tracking/tracking/ClickedUrl | +---------------------------------------------------------------+ </code></pre> <p>源数据帧看起来像这样</p> <p><a href="https://i.stack.imgur.com/uxsPW.jpg" rel="nofollow noreferrer">enter image description here</a></p> <p>现在我正在运行pyspark UDF来应用于“path”列,它会在列中找到“opened”还是“clicked”,并给我一个新的dataframe,其中“path”列的值为10或20,其他值为null,具体取决于opened clicked或else条件</p> ^{pr2}$ <p>结果显示在“Path”列中为null,而不是值10或20</p> <p><a href="https://i.stack.imgur.com/KhB60.jpg" rel="nofollow noreferrer">enter image description here</a></p> <p>如果我做任何事情都不需要整数值的帮助,我会非常感激。提前谢谢</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>您需要从函数返回值,而不是打印它们。像这样-</p> <pre><code>def clickopen(x): if 'opened' in x.lower().split('/'): return 10 elif 'clickedurl' in x.lower().split('/'): return 20 else: return None </code></pre> <p>我不知道如何在pySpark中返回null。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何在Excel中读取公式并将其转换为Python中的计算?
8 回答
如何在excel中读取嵌入的excel,并将嵌入文件中的信息存储在主excel文件中?
9 回答
如何在Excel中返回未知列长度的非空顶行列值?
4 回答
如何在excel中选择数据列?
8 回答
如何在Excel中通过脚本自动为一列中的所有单元格创建公共别名
5 回答
如何在excel中高效格式化范围AttributeError:“tuple”对象没有属性“fill”
8 回答
如何在excel单元格中编写python函数
8 回答
如何在excel单元格中自动执行此python代码?
2 回答
如何在excel工作表中创建具有相应值的新列
7 回答
如何在Excel工作表中复制条件为单元格颜色的python数据框?
5 回答
如何在Excel工作表中循环
3 回答
如何在excel工作表中打印嵌套词典?
10 回答
如何在excel工作表中绘制所有类的继承树?
1 回答
如何在Excel工作表中自动调整列宽?
7 回答
如何在excel工作表中追加并进一步处理
9 回答
如何在excel工作表之间进行更改?
9 回答
如何在excel或csv上获取selenium数据?
2 回答
如何在Excel或Python中将正确的值赋给正确的列
1 回答
如何在excel或python中提取单词周围的文本?
7 回答
如何在excel或python中转换来自Jira的3w 1d 4h的fromat数据?
3 回答