Python中文
首页
教程
问答
标签
搜索
登录
注册
识别从谷歌专利下载的文件名
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有一个csv文件,其中有大约500个来自谷歌专利的链接,我用scrapy迭代它们,以便从每个链接下载csv文件(每个链接中都有一个下载链接)。我已经成功地实现了这一点,但我现在想做的是从html标记中发现每个下载文件的名称,以便使用python进行编辑。一个示例链接是<a href="https://patents.google.com/?q=O1C(%3dCCCC1C)C&oq=O1C(%3dCCCC1C)C" rel="nofollow noreferrer">https://patents.google.com/?q=O1C(%3dCCCC1C)C&oq=O1C(%3dCCCC1C)C</a>。下载文件的名称是动态生成的,所以有办法找到它吗</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>名字就是日期:gp-search-20210816-142027.csv 2021-08-16 14:20:27</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
使用urllib2进行Web抓取
4 回答
使用urllib2进行Web报废
3 回答
使用urllib2进行简单https身份验证时出现问题(用于获取PayPal OAUTH承载令牌)
9 回答
使用urllib2进行节流
2 回答
使用urllib2远程读取pdf
5 回答
使用urllib2通过flask发送图像
7 回答
使用urllib2通过对等错误重置连接
10 回答
使用urllib2避免503个错误
2 回答
使用urllib2音调符号打开页面
1 回答
使用urllib3 UnicodeDecodeError上载文件
9 回答
使用urllib3.PoolManag时看到ClosedPoolError
1 回答
使用urllib3下载文件的最佳方式是什么
8 回答
使用urllib3下载网页
9 回答
使用urllib3忽略证书验证
3 回答
使用urllib3时的ssl.SSLError
8 回答
使用urllib3的TLS1.1的HTTP GET网站
1 回答
使用urllib3获取JSON d
5 回答
使用urllib3解析来自httpget请求的XML响应
9 回答
使用urllib3进行HTTPS调用时,请使用服务器的ssl证书而不是根CA证书
9 回答
使用urllib3进行多部分表单编码和发布
2 回答