Python中文
首页
教程
问答
标签
搜索
登录
注册
在python中使用giant或regex是低效的吗?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>简单的问题是,在python中使用giant或regex是低效的。我正在构建一个脚本来搜索坏文件。到目前为止,我有一个包含50个左右“签名”的源文件。列表的形式如下:</p> <pre><code> Djfsid LJflsdflsdf fjlsdlf fsdf . . . </code></pre> <p>没有真正的“一致性”,所以通过删除“重复项”或检查“一个条目是另一个条目的子字符串”来优化列表不会有多大作用。你知道吗</p> <p>我基本上不想操作系统走下一个目录,打开一个文件,检查签名,关闭和移动。你知道吗</p> <p>为了加快速度,我将把列表分成50/n个不同的子列表,其中n是核心数,让一个线程处理列表中的几个条目。你知道吗</p> <p>使用巨型regex <code>re.search('(entry1|entry2|entry3....|entryK)', FILE_CONTENTS)</code>或巨型regex <code>for i in xrange(0,NUM_SUBENTRIES)...if subentry[i] in FILE_CONTENTS...</code>会更好吗?你知道吗</p> <p>这也是多线程的好方法吗?这是unix,因此多个线程可以同时在同一个文件上工作。磁盘访问基本上会把我逼到多线程毫无用处的地步吗?你知道吗</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>不要担心优化。你知道吗</p> <p>50个数据点与你的计算机所能管理的相比是很小的,所以你可能会浪费很多时间,使你的程序更复杂。你知道吗</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何实现一个类,该类在每次更改其属性时更改其“last_edited”变量?
1 回答
如何实现一个类?
8 回答
如何实现一个类的属性设置?
10 回答
如何实现一个能够存储输入并反复访问输入的存储系统?GPA计算器
10 回答
如何实现一个自定义的keras层,它只保留前n个值,其余的都归零?
1 回答
如何实现一个行为类似于Python中序列的最小类?
3 回答
如何实现一个请求的多线程或多处理
5 回答
如何实现一个长时间运行的、事件驱动的python程序?
8 回答
如何实现一个颜色一致的非舔深度地图实时?
6 回答
如何实现一个默认的SQLAlchemy模型类,它包含用于继承的公共CRUD方法?
9 回答
如何实现一次热编码的生成函数
9 回答
如何实现一种在数组中删除对的方法
7 回答
如何实现一类支持向量机用于图像异常检测
1 回答
如何实现一维阵列到二维阵列的复制转换
6 回答
如何实现三维三次样条插值?
8 回答
如何实现三维数据的连接组件标签?
4 回答
如何实现三角形的空间索引
3 回答
如何实现不同模块中对象之间的交互
1 回答
如何实现不同版本的库共存?
5 回答
如何实现不同的班权重
6 回答