2024-04-25 14:28:33 发布
网友
任务:每天有大约3万个文本文件。如何找出程序使用正则表达式提取实体的速度(它们的数目大约是20)
这个程序是在Python上设计的。但操作系统和硬件将取决于这样一个程序的最佳性能。在这个阶段,我们需要关于“动态”提取数据的最小可能配置的信息,以及该配置的速度的近似数字-
如果我是你,我会用python编写你的regex,得到30k个测试文件(同一个文件复制了30k次?),看看需要多长时间来处理。然后在python中使用cProfile来分析1个文件的代码,看看在哪里可以加快速度
如果我是你,我会用python编写你的regex,得到30k个测试文件(同一个文件复制了30k次?),看看需要多长时间来处理。然后在python中使用cProfile来分析1个文件的代码,看看在哪里可以加快速度
相关问题 更多 >
编程相关推荐