用python拉网页

1条回答

网友

1楼 · 发布于 2024-05-29 03:44:55

import requests
import xlsxwriter 
from bs4 import BeautifulSoup

from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"
workbook = xlsxwriter.Workbook('C:/Users/Desktop/data.xlsx') 
worksheet = workbook.add_worksheet()
row = 0
column = 0
linkrow =0

urls = ["https://www.esportsearnings.com/tournaments"] #add more url by adding here
for i in urls:
  page = requests.get(i)
  soup = BeautifulSoup(page.content, 'html.parser')
  i=1
  for link in soup.find_all('a'):
      a=link.get('href')
      worksheet.write(linkrow,0,a)
      print(link.get('href'))
      linkrow += 1
workbook.close()      
# for link in soup.find_all('td'):
#     print(link.get_text())

尝试此代码

编程相关推荐

java在Android中维护应用程序状态
javajavacc：如何指定在特定上下文中需要哪些令牌？
java为什么改型会在重新加载数据时设置以前的响应？
java如何将键转换为字符串，反之亦然
java JDOM解析器插入#固定手动属性
java按元素对XML数据排序？
java Android中有哪些哈希算法？
java为什么使用可选返回类型进行单元测试失败？
Gson和argonauts使用Gson将javascript数组转换为json字符串并转换为javapojo时遇到的问题。试图让我的结构正确
java中的空格

相关问题更多 >

编程相关推荐

热门问题

热门文章

用python拉网页

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >