我使用的是来自国务卿的投票历史数据,但是他们给我的.txt文件是700万行,每行是一个包含27个字符的字符串。前3个字符是县的代码。接下来的8个字符是注册ID,接下来的8个字符是投票日期,等等。我无法在excel中对列进行文本处理,因为文件太大。有没有办法在python中将此文件分隔为列
范例
目前我有:
0010000413707312012026R
0010000413708212012027R
0010000413711062012029
0010004535307312012026D
我想有专栏:
001 00004137 07312012 026 R
001 00004137 08212012 027 R
001 00004137 11062012 029
001 00045353 07312012 026 D
其中每个空格分隔一个新列。有什么建议吗?谢谢
试试这个: 我认为您没有阅读表单
txt
文件的问题,简化的情况如下:我能做的最简单的事情是:
产出:
由于文件太大,最好将其读取并保存到其他文件中,而不是在内存中读取整个文件:
您还可以从txt文件中读取要的内容,并使用
extract
划分数据帧列相关问题 更多 >
编程相关推荐