Python中文
首页
教程
问答
标签
搜索
登录
注册
PySpark:如何在dataframe中为特定列填充值?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有以下示例数据框:</p> <pre><code>a | b | c | 1 | 2 | 4 | 0 | null | null| null | 3 | 4 | </code></pre> <p>我只想替换前两列中的空值-列“a”和“b”:</p> <pre><code>a | b | c | 1 | 2 | 4 | 0 | 0 | null| 0 | 3 | 4 | </code></pre> <p>下面是创建示例数据帧的代码:</p> <pre><code>rdd = sc.parallelize([(1,2,4), (0,None,None), (None,3,4)]) df2 = sqlContext.createDataFrame(rdd, ["a", "b", "c"]) </code></pre> <p>我知道如何使用以下方法替换所有空值:</p> <pre><code>df2 = df2.fillna(0) </code></pre> <p>当我尝试这个,我失去了第三栏:</p> <pre><code>df2 = df2.select(df2.columns[0:1]).fillna(0) </code></pre>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<pre><code>df.fillna(0, subset=['a', 'b']) </code></pre> <p>有一个名为<code>subset</code>的参数来选择列,除非您的spark版本低于1.3.1</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
VirtualEnvRapper错误:路径python2(来自python=python2)不存在
1 回答
virtualenvs上的pyinstaller,没有名为导入错误的模块
7 回答
virtualenvs是否可以退回到用户包而不是系统包?
5 回答
virtualenvwrapper CentOS7
10 回答
virtualenvwrapper IOError:[Errno 13]权限被拒绝
9 回答
virtualenvwrapper mkproject和shell在windows中的启动问题?
8 回答
virtualenvwrapper mkvirtualenv不工作但没有错误
6 回答
Virtualenvwrapper python bash
7 回答
virtualenvwrapper:“workon”何时更改到项目目录?
9 回答
virtualenvwrapper:mkvirtualenv可以工作,但是rmvirtualenv返回bash:没有这样的文件或目录
2 回答
virtualenvwrapper:virtualenv信息存储在哪里?
3 回答
virtualenvwrapper:命令“python设置.pyegg_info“失败,错误代码为1
8 回答
virtualenvwrapper:如何将mkvirtualenv的默认Python版本/路径更改为ins
5 回答
Virtualenvwrapper:模块“pkg_resources”没有属性“iter_entry_points”
9 回答
Virtualenvwrapper:没有名为virtualenvwrapp的模块
6 回答
Virtualenvwrapper.bash_profi的正确设置
6 回答
Virtualenvwrapper.hook:权限被拒绝
5 回答
virtualenvwrapper.sh:fork:资源暂时不可用Python/Djang
1 回答
Virtualenvwrapper.shlssitepackages命令不工作
9 回答
Virtualenvwrapper.sh函数在bash sh中不可用
7 回答