Pandas的定宽文件操作

2024-03-29 01:34:40 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个固定宽度的文件,格式如下:

5678223313570888271712000000024XAXX0101010006461801325345088800.0784001501.25abc@yahoo.com                                        
5678223324686600271712000000070XAXX0101010006461801325390998280.0784001501.25abcde.12345@gmail.com                             5678123422992299

我试了一下:

^{pr2}$

现在这肯定有助于我清晰地转换成熊猫的格式。然而,空白(或固定的白色空间)被修剪掉。例如:Email字段(#8)设置了50个固定字符。一旦导入到Pandas dataframe,它们就会被截断。在

对于数据操作,我将创建3个新字段,这些字段是从以前导入的字段的值中提取的。在

最终输出文件结构:

[(0,16)、(16,31)、(31,44)、(44,62)、(62,70)、(70,73)、(73,77)、(77127)、(1271433)、(14353)、(153163)、(164165)]

因为,我还没有在dataframes上找到任何tou-fwf方法或其他Pandas-gt;平面文件(保持原始长度不变)的替代方法,如果有人有更好的解决方案,我将非常感激。在

附言:我读到在Unix中awk/sed工作得更好,但是仍然想知道Python


Tags: 文件方法comdataframepandas宽度email格式