在excel中以两张表的形式保存刮下的文档

import requests from lxml import html from pyexcel_ods3 import save_data name_list = ['Altronix','APC'] def docs_parser(link, name): res = requests.get(link) root = html.fromstring(res.text) vault = {} for post in root.cssselect(".SubBrandList a"): if post.text == name: refining_docs(post.attrib['href'], vault) def refining_docs(new_link, vault): res = requests.get(new_link).text root = html.fromstring(res) sheet = root.cssselect("#BrandContent h2")[0].text for elem in root.cssselect(".ProductDetails"): name_url = elem.cssselect("a[class]")[0].attrib['href'] vault.setdefault(sheet, []).append([str(name_url)]) save_data("docs.ods", vault) if __name__ == '__main__': for name in name_list: docs_parser("http://store.immediasys.com/brands/" , name)

1条回答

网友

1楼 · 发布于 2024-05-19 01:40:48

Question: I thing the first sheet is overwritten and second one is never created. How to get around this so that data will be saved in two sheets in an excel file.

您将覆盖每个要附加的链接上的工作簿文件。
你不应该在循环中调用save_data(...，只能在脚本末尾调用一次。你知道吗

比较两个脚本有没有区别，两个脚本的行为相同，一次又一次地覆盖工作簿文件。当您在短时间内覆盖工作簿文件超过160次时，可能会导致文件IO过载。你知道吗

第一个脚本应创建13张工作表：

data sheet:powerpivot-etc links:20
data sheet:flappy-owl-videos links:1
data sheet:reporting-services-videos links:20
data sheet:csharp links:14
data sheet:excel-videos links:9
data sheet:excel-vba-videos links:20
data sheet:sql-server-videos links:9
data sheet:report-builder-2016-videos links:4
data sheet:ssrs-2016-videos links:5
data sheet:sql-videos links:20
data sheet:integration-services links:19
data sheet:excel-vba-user-form links:20
data sheet:archived-videos links:16

第二个脚本应创建2张工作表：

vault sheet:Altronix links:16
vault sheet:APC links:16

相关问题更多 >

编程相关推荐

热门问题

热门文章