2024-05-15 11:21:59 发布
网友
我刚接大熊猫来做我生物学研究中的一些数据分析工作。结果我分析的一种蛋白质叫做“NA”。
我有一个矩阵,列标题上有一对‘HA,M1,M2,NA,NP…’,和‘行标题’一样(对于可能读到这篇文章的生物学家,我正在研究流感)。
当我直接从CSV文件将数据导入Pandas时,它将“行标题”读取为“HA,M1,M2…”,然后NA被读取为NaN。有什么办法阻止这一切吗?列标题很好-“HA、M1、M2、NA、NP等…”
刚刚遇到这个问题——我为列指定了一个str转换器,这样就可以在其他地方保留na: pd.read_csv(... , converters={ "file name": str, "company name": str})
pd.read_csv(... , converters={ "file name": str, "company name": str})
以这种方式关闭NaN检测:pd.read_csv(filename, keep_default_na=False)
pd.read_csv(filename, keep_default_na=False)
我最初建议na_filter=False,这样可以完成任务。但是,如果我理解杰夫下面的评论,这是一个更干净的解决方案。
na_filter=False
示例:
In [1]: pd.read_csv('test') Out[1]:[4]: pd.read_csv('test', keep_default_na=False) Out[4]:1 2 2 3
刚刚遇到这个问题——我为列指定了一个str转换器,这样就可以在其他地方保留na:
pd.read_csv(... , converters={ "file name": str, "company name": str})
以这种方式关闭NaN检测:
pd.read_csv(filename, keep_default_na=False)
我最初建议
na_filter=False
,这样可以完成任务。但是,如果我理解杰夫下面的评论,这是一个更干净的解决方案。示例:
相关问题 更多 >
编程相关推荐