我有一个文本文件,我想分开每一列。但熊猫将全文视为一列:
6/1/2018 12:01:11.490 AM HEP.U02.OIL.GOV.P2_RUN <Unit #2>No.2 oil pump
runing On
6/1/2018 12:01:19.383 AM HEP.COM.WAT.DRN.P1_CRTL Control No.1 drainage
pump On
6/1/2018 12:01:19.384 AM HEP.COM.WAT.DRN.P1_RUN No.1 drainage pump run
On
6/1/2018 12:01:24.250 AM HEP.U02.OIL.GOV.LV_TL <Unit #2>Oil level of
sump too low Off
6/1/2018 12:01:24.859 AM HEP.U02.OIL.GOV.P2_RUN <Unit #2>No.2 oil pump
runing Off
6/1/2018 12:02:07.564 AM HEP.U02.OIL.GOV.LV_TL <Unit #2>Oil level of
sump too low On
我的数据是这样的:
import re
import pandas as pd
p=[]
df=pd.read_csv('./mine.txt',encoding='ISO-8859-1', sep='delimeter',
engine='python' ,nrows=100)
print(df.shape)
df=df.columns.str.split('\t')
print(list(df))
print(df.shape)
df.shape()
返回(100,1)
之前和(1,)
之后str.split()
我怎样才能把这些列分开?你知道吗
您将数据分隔在选项卡上,而不是空格上。如果您的文件是.tsv(制表符分隔的值),这是有意义的。应该用“\t”分隔,如果不是,应该用“\s”分隔空格,而不是制表符。这就是为什么你只得到(1,)之后结构拆分(“\t”)。你知道吗
相关问题 更多 >
编程相关推荐