python3如何删除以函数开头的行

2024-04-25 12:44:35 发布

您现在位置:Python中文网/ 问答频道 /正文

我想删除50000个维基页面中的一行。因为那行是一个死的外部网页链接。例如,看看this wiki page. 这条线由两部分组成。一个是起始文本,另一个是URL。 每个单词的URL都不同,但文本总是以“*தமிழ்இணையப்பல்கலைக甍猷瓥瓑ி瓜瓹瓹ில்”开头。如何删除以fuction开头的行?你知道吗

Sample code :

#!/usr/bin/env python
#-*- coding: utf-8 -*-
wikiPage = '''==உசாத்துணை== 
* தமிழ் இணையப் பல்கலைக்கழக அகரமுதலியில்  [http://www.tamilvu.org/slet/servlet/o33.o33searh?CboSelect=1&TxtSearch=abdominal+muscle&OptSearch=&id=All abdominal muscle]'''

# part1 is a line of  'starts with'
part1 = '* தமிழ் இணையப் பல்கலைக்கழக அகரமுதலியில் '
part2 = '[http://www.tamilvu.org/slet/servlet/o33.o33searh?CboSelect=1&TxtSearch=abdominal+muscle&OptSearch=&id=All abdominal muscle]'
print(wikiPage.replace('part1',''))

如何删除part2呢?请注意,第2部分是一个不同于每个wiki页面的url。你知道吗


Tags: org文本httpurlwwwwiki页面part1
2条回答

创建一个新的行列表(或者以存储行的方式),然后遍历旧列表,只添加不以该字符串开头的行。你知道吗

START_OF_LINE = "*தமிழ் இணையப் பல்கலைக்கழக அகரமுதலியில்"
new_lines = [] # or however you store lines

for line in lines:
    if line.startswith(START_OF_LINE):
        pass
    else:
        new_lines.append(line)
s_line = '*தமிழ் இணையப் பல்கலைக்கழக அகரமுதலியில்'

lines = [line for line in lines if not line.startswith(s_line)]

相关问题 更多 >