在python中循环以从URL获取标题标记

2条回答

网友

1楼 · 编辑于 2024-05-12 20:09:06

如果你有更多的url，添加到lst。你得到了所有的标题。您可以尝试以下脚本：

import urllib.request as urllib2
from bs4 import BeautifulSoup

lst = ["https://player.vimeo.com/video/1234","https://player.vimeo.com/video/1235"]
title = []
for a in lst:    
    soup = BeautifulSoup(urllib2.urlopen(a), 'lxml')
    title.append(soup.title.string)

print(title)

输出将是：

['Diving catch from Chris Bodenner on Vimeo', 'Hit with box from Chris Bodenner on Vimeo']

或

import urllib.request as urllib2
from bs4 import BeautifulSoup

lst = ["https://player.vimeo.com/video/1234","https://player.vimeo.com/video/1235"]
title = []
for a in lst:    
    soup = BeautifulSoup(urllib2.urlopen(a), 'lxml')
    title.append(soup.title.string)
    print (a + " : " + soup.title.string)

输出将是：

https://player.vimeo.com/video/1234 : Diving catch from Chris Bodenner on Vimeo
https://player.vimeo.com/video/1235 : Hit with box from Chris Bodenner on Vimeo

网友

2楼 · 编辑于 2024-05-12 20:09:06

您可以这样做：

import urllib.request as urllib2
from bs4 import BeautifulSoup

start_idx, end_idx = 1234, 1245

for idx in range(start_idx, end_idx):
  a = f"https://player.vimeo.com/video/{idx}"
  soup = BeautifulSoup(urllib2.urlopen(a))
  print (f"for url:{a}, title: {soup.title.string}")

根据需要正确设置start_idx和end_idx

另外，您可能需要处理由于禁止访问某些URL而可能出现的HTTPError

相关问题更多 >

编程相关推荐

热门问题

热门文章

在python中循环以从URL获取标题标记

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >