从csv fi中刮取多个URL

from bs4 import BeautifulSoup import requests import csv with open("safari history.csv") as f_urls, open("Titles.txt", "w", newline="") as f_output: csv_output = csv.writer(f_output) csv_output.writerow(['Title']) for url in f_urls: #url = url.strip() #t = lxml.html.parse(url) response = requests.get(url) soup = BeautifulSoup(response.text, "lxml") titles = soup.find_all('meta') print( [meta.attrs['content']for meta in titles if 'name' in meta.attrs and meta.attrs['name'] == 'description']) csv_output.writerow([titles])

1条回答

网友

1楼 · 发布于 2024-04-19 18:54:01

如果有一个特定的错误不断被抛出，您可以使用try/except块来处理一个成功并简单地传递错误：

try:
    do_work(url)
except YourExceptionType:
    #Do nothing
    pass

来自shell的小示例：

>>> float("not a float")
Traceback (most recent call last):
  File "<pyshell#51>", line 1, in <module>
    float("not a float")
ValueError: could not convert string to float: 'not a float'
>>> s = "not a float"
>>> try:
    print(float(s))
except ValueError:
    print("Exception caught")


Exception caught
>>>

相关问题更多 >

编程相关推荐

热门问题

热门文章