在python中使用正则表达式解析web日志文件

189.254.43.43 - swift6867 [21/Jun/2019:15:53:00 -0700] "GET /architectures/recontextualize/morph/scale HTTP/1.0" 204 8976 20.80.28.12 - hagenes4423 [21/Jun/2019:15:53:01 -0700] "POST /harness HTTP/1.1" 404 28127 112.211.50.38 - - [21/Jun/2019:15:53:03 -0700] "DELETE /harness/e-business/functionalities HTTP/1.1" 405 7975

1条回答

网友

1楼 · 发布于 2024-05-16 03:40:48

您可以使用下一个正则表达式（demo）：

^(?P<host>(?:\d+\.?){4})\s*-\s*(?P<user_name>[^\s-]*?)\s

要创建DICT列表，可以对^{}返回的每个^{}对象应用^{}：

import re
...
pattern = r'^(?P<host>(?:\d+\.?){4})\s*-\s*(?P<user_name>[^\s-]*?)\s'
result = [i.groupdict() for i in re.finditer(pattern, logdata, re.MULTILINE)]

这个正则表达式（demo）的步骤稍微少一点，所以对于较大的数据，它应该稍微快一点：

^(?P<host>\d+\.\d+\.\d+\.\d+)\s*-\s*(?P<user_name>[^\s-]*?)\s

编程相关推荐

java如何避免springbootstarterparent和dependency中的flyway包冲突
java文本文件写入不起作用
java获取名为DAO类的Bean创建异常
java类路径和清单文件
如何使用Java中的模式来获取像C中的“sscanf”这样的组？
java Spring自动连接具有构造函数的类
clientSecurity运行的java geode示例失败
java JavaFX：在FXML中从ResourceBundle访问非string对象
java登录到google firebase
java对象在通过构造函数后不会更改。为什么？

相关问题更多 >

编程相关推荐

热门问题

热门文章

在python中使用正则表达式解析web日志文件

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >