Python中文
首页
教程
问答
标签
搜索
登录
注册
移除空单元格行的Pandas操作?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>谢谢你的帮助。在</p> <p>我有一个很大的csv伪幻觉病人数据集,通常看起来像这样。在</p> <pre><code> Average Covered Charges , Total Discharges , Average Medicare Payments 32963.07 , 91 , 4763.73 15131.85 , 14 , 4976.71 37560.37 , , </code></pre> <p>我面临的问题是,我试图得到总放电数大于100。。。但是,由于其中一列的末尾比所有其他单元格多了一个值,所以其他列的最后一个单元格只有一个空白空间,这将作为数据集长度中的一个项进行计数。我已经将这个csv文件加载到pandas数据框中,并删除了NAs,我的数据集仍然是这样的。在</p> <p>所以,没有,等等。。。不是问题。它是一个空单元格,它使最后两列的数据类型为“object”,并且因为它有一个空白单元格/空白空间,所以不可能将“object”数据类型更改为“int”</p> <p>若我可以通过<strong>删除数据集中任何列中有空单元格的所有行,将数据帧改成这样,那个么我的所有问题都会消失。所以我希望我的数据集是这样的:</p> ^{pr2}$ <p>我很惊讶我这么难做这件事。但从我所读到的关于熊猫的资料来看,文件假设那些是NAs,所以我可以直接扔掉它们,但我根本不能让熊猫相信这一点。在</p> <pre><code> import pandas as pd inpatients_df = pd.read_csv("inpatient_payment_system.csv", low_memory = False) inpatients_df.dropna(axis = 0, how = 'any') # Remove NA values. </code></pre> <p>我已经加载了数据集并删除了所有的NAs,这并不重要。在</p> <p>注意:这个数据集中有超过3列的数据。只需要一列包含比其他列更多的entre就可以了,问题实际上发生在csv文件的最后一行。在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>只需将其中一个列作为一个系列,然后使用它:</p> <pre><code>pd.to_numeric(df['Total Discharges'], errors='coerce').dropna() > 100).sum() </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
将Pandas数据帧转换为PyTorch张量?
5 回答
将Pandas数据帧转换为scipy稀疏矩阵
4 回答
将Pandas数据帧转换为Spark Datafram时出现问题
9 回答
将pandas数据帧转换为spark DataFram时出错
2 回答
将Pandas数据帧转换为spark datafram时收到错误
7 回答
将Pandas数据帧转换为Spark数据帧
5 回答
将Pandas数据帧转换为Tensorflow数据
1 回答
将Pandas数据帧转换为tkinter obj
5 回答
将pandas数据帧转换为XML
2 回答
将Pandas数据帧转换为值sql语句
9 回答
将pandas数据帧转换为元组
7 回答
将pandas数据帧转换为元组列表
1 回答
将pandas数据帧转换为元组列表并删除所有pandas数据类型
7 回答
将pandas数据帧转换为具有头和数据类型的numpy数组
10 回答
将pandas数据帧转换为内存中的拼花地板,并将其加载到Python中的Hadoop中
3 回答
将pandas数据帧转换为内存中类似文件的对象?
7 回答
将Pandas数据帧转换为内存功能(&F)
4 回答
将pandas数据帧转换为列表列表
6 回答
将pandas数据帧转换为列表列表以输入到RNN
5 回答
将Pandas数据帧转换为单行DataFram
7 回答