我有一个固定宽度的文件,格式如下:
5678223313570888271712000000024XAXX0101010006461801325345088800.0784001501.25abc@yahoo.com
5678223324686600271712000000070XAXX0101010006461801325390998280.0784001501.25abcde.12345@gmail.com 5678123422992299
我试了一下:
^{pr2}$现在这肯定有助于我清晰地转换成熊猫的格式。然而,空白(或固定的白色空间)被修剪掉。例如:Email字段(#8)设置了50个固定字符。一旦导入到Pandas dataframe,它们就会被截断。在
对于数据操作,我将创建3个新字段,这些字段是从以前导入的字段的值中提取的。在
最终输出文件结构:
[(0,16)、(16,31)、(31,44)、(44,62)、(62,70)、(70,73)、(73,77)、(77127)、(1271433)、(14353)、(153163)、(164165)]
因为,我还没有在dataframes上找到任何tou-fwf方法或其他Pandas-gt;平面文件(保持原始长度不变)的替代方法,如果有人有更好的解决方案,我将非常感激。在
附言:我读到在Unix中awk/sed工作得更好,但是仍然想知道Python
目前没有回答
相关问题 更多 >
编程相关推荐