抓取网站在线或离线数据处理是b

2024-06-16 09:42:51 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在为一个使用Python Beautifulsoup的研究项目抓取网站。 我已经收集了几千张记录,并把它们放在excel中。在

本质上,我想提取一个子串文本(例如,“python”来自一篇文章标题“python for dummies”)。 文章标题被刮取并存储在excel的单元格中。 我想提取“pyhon”放在另一个牢房里。在

我需要一些建议,如果它是更好的提取时,刮或离线在excel。 由于这是一个研究项目,不需要实时速度。我在省力。在

另一个相关的问题是python是否可以在脱机模式下进行提取-即打开excel,执行提取,关闭excel。在

任何帮助或建议都非常感谢。在


Tags: 项目文本标题for网站记录文章excel