如何打开我的txt文件,并删除一些特殊字符从txt文件的一些推文。你知道吗
我的文字看起来像这样
@xirwinshemmo thanks for the follow :)
hii... if u want to make a new friend just add me on facebook! :) xx https:\/\/t.co\/RCYFVrmdDG
@ycmaP enjoy tmrro. saw them earlier this wk here in tokyo :)
我必须摆脱一切从@ 以及每个网页(http) 我该怎么做?你知道吗
我已经试过了。你知道吗
import re
a = []
with open('englishtweets1.txt','r') as inf:
a = inf.readlines()
for line in a:
line = re.sub(r['@'], line)
一气呵成
如果您的文件不是很大,您可以一次性完成:
结果:
请注意,http剥离非常简单,它将剥离以http开头的任何内容。要解决这个问题,可以改进regex以搜索有效的httpurl。你知道吗
逐行
如果您的文件非常大,您可能不想将其全部存储在内存中。您可以迭代文件中的所有行:
像这样使用它
更新 这是工作刚刚测试
相关问题 更多 >
编程相关推荐