使用regexp加速

2024-04-25 14:28:33 发布

您现在位置:Python中文网/ 问答频道 /正文

任务:每天有大约3万个文本文件。如何找出程序使用正则表达式提取实体的速度(它们的数目大约是20)

这个程序是在Python上设计的。但操作系统和硬件将取决于这样一个程序的最佳性能。在这个阶段,我们需要关于“动态”提取数据的最小可能配置的信息,以及该配置的速度的近似数字-


Tags: 数据程序实体信息硬件动态数字性能
1条回答
网友
1楼 · 发布于 2024-04-25 14:28:33

如果我是你,我会用python编写你的regex,得到30k个测试文件(同一个文件复制了30k次?),看看需要多长时间来处理。然后在python中使用cProfile来分析1个文件的代码,看看在哪里可以加快速度

相关问题 更多 >