如何使用pandas将python webscrape数据导出到现有excel文件中的特定工作表中?

2024-03-29 13:44:29 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个包含多个工作表的Excel文件。我想用pandas将Python中的新数据添加到同一个Excel文件中的新工作表中。在不影响我以前的数据的情况下,这样做是否可行?我是新来的。。。谢谢你的帮助!在

以下是我目前使用的Python代码:

from urllib.request import urlopen
from lxml import html
import cssselect

response = urlopen("https://www.xyz.com.shtml")
content = response.read()
tree = html.fromstring(content)

for div in tree.cssselect('.first_name'):
for a in div.cssselect('table:nth-child(2) a'):
    print(a.text)

我在网上找到的。。。我只是有点困惑如何在我目前的情况下使用它:

^{pr2}$

Tags: 文件数据infromimportdivtreefor
1条回答
网友
1楼 · 发布于 2024-03-29 13:44:29

好像你想在一个类中抓取一个网站和一个表元素。我建议你改用beauthoulsoup。在

台阶

  1. 在课堂上拿你的桌子
  2. 把你的数据加到字典里
  3. 转换为数据帧
  4. 将数据框导出到excel

    from lxml import html
    from bs4 import BeautifulSoup
    import requests
    import pandas
    
    req = requests.get('https://www.xyz.com.shtml')
    soup = BeautifulSoup(req.text, "lxml")
    
    content =  soup.find("table:nth-child(2) a", {"class": "first_name"})
    mydict = dict()
    for c in content:
      #from c append data in mydict
      # example: mydict['Data'].append(c.text)
    
    df = pd.DataFrame(mydict)
    writer = pd.ExcelWriter('pandas_simple.xlsx')
    df.to_excel(writer,'Sheet1')
    writer.save()
    

相关问题 更多 >