Web抓取没有锚定标记或按钮的特定表,

2024-06-16 11:09:29 发布

您现在位置:Python中文网/ 问答频道 /正文

嗨,我正在用漂亮的汤从下面的网站(https://www.otcmarkets.com/market-activity/corporate-actions)上刮桌子。 有一个名为“符号更改”的表。我想获取表中的数据。我能够在加载页面中捕获数据,但下面有一个名为more的类。我不能用selenium单击该类。我使用了下面的代码来查找元素

html页面的代码

<div class="_2sFaw3zGf1">
   More 
   <svg fill="currentColor" preserveAspectRatio="xMidYMid meet" height="1em" width="1em" viewBox="0 0 40 40" class="APX-ntK2Ti" style="vertical-align: middle;">
      <g>
         <path d="m37.6 18l-16.6 16.6q-0.4 0.4-1 0.4t-1-0.4l-16.6-16.6q-0.4-0.4-0.4-1t0.4-1l3.7-3.7q0.5-0.4 1-0.4t1 0.4l11.9 11.9 11.9-11.9q0.4-0.4 1-0.4t1 0.4l3.7 3.7q0.4 0.4 0.4 1t-0.4 1z"></path>
      </g>
   </svg>
</div>

用于执行单击事件的代码

d = driver.find_element_by_xpath("/[contains(text()='More')]")
d.click()

既然这不是一个按钮对象或锚定标记,我应该如何继续?先谢谢你


Tags: 数据path代码httpssvgdivcom网站
1条回答
网友
1楼 · 发布于 2024-06-16 11:09:29

尝试使用请求和命令:

import requests
import pandas as pd

r = requests.get("https://backend.otcmarkets.com/otcapi/corp-actions/symbol-changes?route=symbol-changes&pageSize=900&retainPageSize=true")
df = pd.DataFrame(r.json())
print(df.shape)
print(df)

相关问题 更多 >