Python中文
首页
教程
问答
标签
搜索
登录
注册
在python中使用giant或regex是低效的吗?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>简单的问题是,在python中使用giant或regex是低效的。我正在构建一个脚本来搜索坏文件。到目前为止,我有一个包含50个左右“签名”的源文件。列表的形式如下:</p> <pre><code> Djfsid LJflsdflsdf fjlsdlf fsdf . . . </code></pre> <p>没有真正的“一致性”,所以通过删除“重复项”或检查“一个条目是另一个条目的子字符串”来优化列表不会有多大作用。你知道吗</p> <p>我基本上不想操作系统走下一个目录,打开一个文件,检查签名,关闭和移动。你知道吗</p> <p>为了加快速度,我将把列表分成50/n个不同的子列表,其中n是核心数,让一个线程处理列表中的几个条目。你知道吗</p> <p>使用巨型regex <code>re.search('(entry1|entry2|entry3....|entryK)', FILE_CONTENTS)</code>或巨型regex <code>for i in xrange(0,NUM_SUBENTRIES)...if subentry[i] in FILE_CONTENTS...</code>会更好吗?你知道吗</p> <p>这也是多线程的好方法吗?这是unix,因此多个线程可以同时在同一个文件上工作。磁盘访问基本上会把我逼到多线程毫无用处的地步吗?你知道吗</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>这将取决于你使用的机器。如果你使用机器的最大容量,它当然会减速。我想最好的办法就是试试看。你知道吗</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
Python中两个字典的交集
1 回答
python中两个字符串上的异或操作数?
8 回答
Python中两个字符串中的类似句子
5 回答
Python中两个字符串之间的Hamming距离
2 回答
python中两个字符串之间的匹配模式
2 回答
python中两个字符串之间的按位或
5 回答
python中两个字符串之间的数据(字节)切片
9 回答
python中两个字符串之间的模式
4 回答
python中两个字符串作为子字符串的区别
2 回答
Python中两个字符串元组的比较
5 回答
Python中两个字符串列表中的公共字符串
5 回答
python中两个字符串的Anagram测试
9 回答
Python中两个字符串的正则匹配
9 回答
python中两个字符串的笛卡尔乘积
4 回答
Python中两个字符串相似性的比较
8 回答
python中两个字符串语义相似度的求法
2 回答
Python中两个字符置换成固定长度的字符串,每个字符的数目相等
7 回答
Python中两个对数方程之间的插值和平滑数据
8 回答
Python中两个对象之间的And/Or运算符
10 回答
python中两个嵌套字典中相似键的和值
4 回答