Python中文
首页
教程
问答
标签
搜索
登录
注册
从大文件中删除精确的字符串?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我在文件中有以下格式的数据:</p> <pre><code> <http://purl.uniprot.org/here> <http://purl.uniprot.org/here/unipot/purl> <http://purl.uniprot.org/uniprot/Q196Y7> <http://purl.uniprot.org/core/annotation> </code></pre> <p>我想删除角括号内的所有“<a href="http://purl.uniprot.org" rel="nofollow">http://purl.uniprot.org</a>”。这样我得到的输出是</p> <pre><code> <here> <here/unipot/purl> <uniprot/Q196Y7> <core/annotation> </code></pre> <p>我试着用vi的replace命令来实现。但结果是相当慢,因为我的文件是1TB。使用linux/python有没有更有效的方法来做同样的事情</p> <p>我知道我可以使用sed,但是sed找到了sed的模式并删除了它们,而我想删除确切的内容</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>这应该从命令行执行:</p> <pre><code>sed -i 's/http:\/\/purl.uniprot.org\///g' /path/to/filename </code></pre> <p>您可以先不使用<code>-i</code>参数来查看控制台中的输出。你知道吗</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
jupyter运行一个旧的pytorch版本
4 回答
Jupyter运行不同版本的卸载库?
3 回答
Jupyter运行指定的键盘快捷键
7 回答
Jupyter通过.local文件“逃逸”virtualenv。我该如何缓解这种情况?
7 回答
Jupyter重新加载自定义样式
6 回答
Jupyter错误:“没有名为Jupyter_core.paths的模块”
10 回答
jupyter错误:无法在随机林中将决策树视为png
9 回答
Jupyter错误'内核似乎已经死亡,它将自动重新启动'为一个给定的代码块
8 回答
Jupyter错误地用阿拉伯语和字母数字元素显示Python列表
4 回答
Jupyter隐藏数据帧索引,但保留原始样式
9 回答
Jupyter集线器:启动器中出现致命错误。。。系统找不到指定的文件
9 回答
Jupyther中相同值的相同哈希,但导出到Bigquery时不相同
9 回答
Jupy上Python的读/写访问问题
1 回答
jupy上没有模块cv
5 回答
Jupy上的排序错误
1 回答
Jupy中bqplot图形的紧凑布局
3 回答
Jupy中matplotlib plot的连续更新
9 回答
Jupy中Numpy函数的文档
5 回答
Jupy中Pandas的自动完成问题
9 回答
jupy中Qt后端的Matplotlib动画
9 回答