如何解析文本文件中的列?

2024-05-23 19:09:26 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个文本文件,我想分开每一列。但熊猫将全文视为一列:

   6/1/2018 12:01:11.490 AM HEP.U02.OIL.GOV.P2_RUN  <Unit #2>No.2 oil pump 
   runing   On      
   6/1/2018 12:01:19.383 AM HEP.COM.WAT.DRN.P1_CRTL Control No.1 drainage 
   pump On      
   6/1/2018 12:01:19.384 AM HEP.COM.WAT.DRN.P1_RUN  No.1 drainage pump run   
   On       
   6/1/2018 12:01:24.250 AM HEP.U02.OIL.GOV.LV_TL   <Unit #2>Oil level of 
   sump too low Off     
   6/1/2018 12:01:24.859 AM HEP.U02.OIL.GOV.P2_RUN  <Unit #2>No.2 oil pump 
   runing   Off     
   6/1/2018 12:02:07.564 AM HEP.U02.OIL.GOV.LV_TL   <Unit #2>Oil level of 
   sump too low On

我的数据是这样的:

import re
import pandas as pd
p=[] 
df=pd.read_csv('./mine.txt',encoding='ISO-8859-1', sep='delimeter', 
engine='python' ,nrows=100)
print(df.shape)
df=df.columns.str.split('\t')
print(list(df))
print(df.shape)

df.shape()返回(100,1)之前和(1,)之后str.split()

我怎样才能把这些列分开?你知道吗


Tags: rundfonunitamhepgovprint
1条回答
网友
1楼 · 发布于 2024-05-23 19:09:26

您将数据分隔在选项卡上,而不是空格上。如果您的文件是.tsv(制表符分隔的值),这是有意义的。应该用“\t”分隔,如果不是,应该用“\s”分隔空格,而不是制表符。这就是为什么你只得到(1,)之后结构拆分(“\t”)。你知道吗

相关问题 更多 >