我有一个txt文件,如下所示:
MT0111500000000 Anniston-Oxford-Jacksonville, AL Metropolitan Statistical Area
MT0112220000000 Auburn-Opelika, AL Metropolitan Statistical Area
MT0113820000000 Birmingham-Hoover, AL Metropolitan Statistical Area
我需要从中创建一个csv文件,我在这方面没有什么经验,但一直在学习和做,尽管可能效率不高
我现在的问题是,当我使用pandas时,它会在“,”之后创建列。我需要的是列分隔符位于左侧代码“MT0113820000000”之后,尽管代码确实发生了变化,但它们的长度都相同
提前谢谢,我知道这是一个非常棘手的问题
这是我目前的代码:
import pandas as pd
dataframe1 = pd.read_csv("C:/Users/andre/Desktop/bea_api_test/python-bureau-economic-analysis-api-client/testttt/output.txt")
dataframe1.to_csv('output_.csv', index = None)
以及输出:
COLUMN 1 COLUMN 2
MT0111500000000 Anniston-Oxford-Jacksonville | AL Metropolitan Statistical Area
您可以在第一次出现空白时分割数据:
或者,使用上面评论中提到的
read_fwf
:这不是一个CSV,我看不到一个方便的方法来说服
read_csv
做正确的事情。幸运的是,这里似乎有一条简单的规则。第一个空间之前的东西,然后是后面的东西str.split
就是这样做的输出
在本例中,我立即编写了csv,以便自动从内存中删除数据帧。您也可以使用CSV模块,一次写一行。这将使用更少的内存,因为它不必将整个文件保存在内存中。由于
csv
是标准python库的一部分,因此pandas
没有外部依赖性。添加一点文件名处理相关问题 更多 >
编程相关推荐