Python selenium从表和cli中提取数据

2条回答

网友

1楼 · 编辑于 2024-05-23 15:59:15

这应该很简单。流程应该是这样的：

导航到页面
关闭弹出对话框
等待数据加载
在公司链接中循环单击每个链接，从新选项卡获取数据，关闭新选项卡，切换回主窗口

from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

url = "https://www2.sgx.com/securities/corporate-information?country=SINGAPORE"
driver.get(url)

wait = WebDriverWait(driver, 10)

# close the preview warning dialog
wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR, "#beta-warning-dialog button"))).click()

# wait for the data to be loaded
company_name_locator = (By.CSS_SELECTOR, "div.table-container a")
wait.until(EC.visibility_of_element_located(companyNameLocator))

main_window_handle = driver.current_window_handle
# loop through visible company links
links = list(filter(lambda e: e.is_displayed(), driver.find_elements(companyNameLocator)))
for link in links
    link.click()

    # wait for new tab to open
    wait.until(lambda d: len(d.window_handles) == 2)
    driver.switch_to_window(driver.window_handles[1])

    # scrape something off the page
    print(wait.until(EC.visibility_of_element_located(By.ID, "ctl07_lblCompName")).text)

    # close the current tab
    driver.close()

    # wait for the tab to be closed and switch back to the main tab
    wait.until(lambda d: len(d.window_handles) == 1)
    driver.switch_to_window(main_window_handle)

网友

2楼 · 编辑于 2024-05-23 15:59:15

试试下面的方法。我使用了XPath Helper Wizard，这是chrome的一个插件。在

链接中的主表：（将sgx表格行[RowNumberHere]更改为循环访问第1列中的公司）

driver.find_element_by_xpath("//sgx-table-row[1]/sgx-table-cell-link[contains(@class, 'sgx-table-cell')]").click()

在Company link链接内：（将/tr[RowNumberHere]更改为变量以进行循环）

^{pr2}$

返回页面：

driver.back()

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python selenium从表和cli中提取数据

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >