Python中文
首页
教程
问答
标签
搜索
登录
注册
在python中使用giant或regex是低效的吗?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>简单的问题是,在python中使用giant或regex是低效的。我正在构建一个脚本来搜索坏文件。到目前为止,我有一个包含50个左右“签名”的源文件。列表的形式如下:</p> <pre><code> Djfsid LJflsdflsdf fjlsdlf fsdf . . . </code></pre> <p>没有真正的“一致性”,所以通过删除“重复项”或检查“一个条目是另一个条目的子字符串”来优化列表不会有多大作用。你知道吗</p> <p>我基本上不想操作系统走下一个目录,打开一个文件,检查签名,关闭和移动。你知道吗</p> <p>为了加快速度,我将把列表分成50/n个不同的子列表,其中n是核心数,让一个线程处理列表中的几个条目。你知道吗</p> <p>使用巨型regex <code>re.search('(entry1|entry2|entry3....|entryK)', FILE_CONTENTS)</code>或巨型regex <code>for i in xrange(0,NUM_SUBENTRIES)...if subentry[i] in FILE_CONTENTS...</code>会更好吗?你知道吗</p> <p>这也是多线程的好方法吗?这是unix,因此多个线程可以同时在同一个文件上工作。磁盘访问基本上会把我逼到多线程毫无用处的地步吗?你知道吗</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>不要担心优化。你知道吗</p> <p>50个数据点与你的计算机所能管理的相比是很小的,所以你可能会浪费很多时间,使你的程序更复杂。你知道吗</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
jupyter运行一个旧的pytorch版本
10 回答
Jupyter运行不同版本的卸载库?
8 回答
Jupyter运行指定的键盘快捷键
7 回答
Jupyter通过.local文件“逃逸”virtualenv。我该如何缓解这种情况?
6 回答
Jupyter重新加载自定义样式
5 回答
Jupyter错误:“没有名为Jupyter_core.paths的模块”
9 回答
jupyter错误:无法在随机林中将决策树视为png
6 回答
Jupyter错误'内核似乎已经死亡,它将自动重新启动'为一个给定的代码块
9 回答
Jupyter错误地用阿拉伯语和字母数字元素显示Python列表
10 回答
Jupyter隐藏数据帧索引,但保留原始样式
8 回答
Jupyter集线器:启动器中出现致命错误。。。系统找不到指定的文件
2 回答
Jupyther中相同值的相同哈希,但导出到Bigquery时不相同
9 回答
Jupy上Python的读/写访问问题
7 回答
jupy上没有模块cv
5 回答
Jupy上的排序错误
9 回答
Jupy中bqplot图形的紧凑布局
4 回答
Jupy中matplotlib plot的连续更新
9 回答
Jupy中Numpy函数的文档
10 回答
Jupy中Pandas的自动完成问题
4 回答
jupy中Qt后端的Matplotlib动画
6 回答