我要参加Udacity的计算机科学导论课程,其中一个作业我必须编写代码,从网页上获取所有链接。这是密码
def get_next_target(page):
start_link = page.find('<a href=')
while True:
if start_link == -1:
x, y = None, 0
return x, y
break
start_quote = page.find('"', start_link)
end_quote = page.find('"', start_quote + 1)
url = page[start_quote + 1:end_quote]
return url, end_quote
当我运行示例时,它似乎可以工作,但是当我提交代码时,我得到的结果是我的提交没有终止。这是什么意思?我的代码有什么问题?你知道吗
但我建议使用正则表达式,比如:
编辑: 但这两种解决方案都无法检测到以下链接:
为此,需要重新创建正则表达式。这是最好的选择。你知道吗
相关问题 更多 >
编程相关推荐