出于某种奇怪的原因,我不得不按以下格式读取日志文件:
Tue Apr 3 08:51:05 2018 foo=123 bar=321 spam=eggs msg="String with spaces in it"
Tue Apr 3 10:31:46 2018 foo=111 bar=222 spam=eggs msg="Different string with spaces"
...
我想将其作为以下数据帧读入:
^{pr2}$其中每个<key>=<value>
都有自己的列,开始的日期是它自己的列,名为time
。在
有没有一种pandas
的处理方法?(或仅<key>=<value>
部分?)
或者,至少,有没有比regex更好的方法将所有这些拆分成pandas
可以接受的形式?在
感谢@edouardtheron&the module
shlex
向正确方向轻推。在如果您有更好的解决方案,请随时回答
但是,我想到的是,首先,导入库:
创建一些示例数据:
^{pr2}$创建与整行匹配但将其分组到
1:开始日期
((?:[a-zA-Z]{3,4} ){2} \d \d\d:\d\d:\d\d \d{4})
2:其他一切
(.*)
通过{cd4}在循环中使用
最后将所有行连接到一个数据帧中:
这将生成以下数据帧:
相关问题 更多 >
编程相关推荐