Pandas将“NA”转换为“NaN”

2024-05-15 11:21:59 发布

您现在位置:Python中文网/ 问答频道 /正文

我刚接大熊猫来做我生物学研究中的一些数据分析工作。结果我分析的一种蛋白质叫做“NA”。

我有一个矩阵,列标题上有一对‘HA,M1,M2,NA,NP…’,和‘行标题’一样(对于可能读到这篇文章的生物学家,我正在研究流感)。

当我直接从CSV文件将数据导入Pandas时,它将“行标题”读取为“HA,M1,M2…”,然后NA被读取为NaN。有什么办法阻止这一切吗?列标题很好-“HA、M1、M2、NA、NP等…”


Tags: 文件csv标题np矩阵蛋白质na大熊猫
2条回答

刚刚遇到这个问题——我为列指定了一个str转换器,这样就可以在其他地方保留na: pd.read_csv(... , converters={ "file name": str, "company name": str})

以这种方式关闭NaN检测:pd.read_csv(filename, keep_default_na=False)

我最初建议na_filter=False,这样可以完成任务。但是,如果我理解杰夫下面的评论,这是一个更干净的解决方案。

示例:

In [1]: pd.read_csv('test')
Out[1]:[4]: pd.read_csv('test', keep_default_na=False)
Out[4]:1   2
2   3

相关问题 更多 >