如果我想得到这个网站上表格的内容，应该读什么HTML标签（网页抓取）

2条回答

网友

1楼 · 编辑于 2024-05-21 05:20:44

所有的表都有一个类DataGridStyle和包含内容的行Contents，因此如果您想要表的所有内容，您应该在所有这些tr中获得td，因此遍历将使用table.DataGridStyle tr.Contents > td完成。你知道吗

你可以在javascript控制台上尝试，使用。。。你知道吗


const tds = document.querySelectorAll('table.DataGridStyle tr.Contents > td')

// The, per every td you would use the property `innerText`
// to get only the text with no HTML at all. For instance:
console.log(tds[5].innerText)
// "۱۳۴,۱۰۰"

希望有帮助

网友

2楼 · 编辑于 2024-05-21 05:20:44

看起来你可以模仿POST请求并传递合同代码

import requests

data = {'ContractCode' : 'OSFKH98'}
r = requests.post('http://cdn.ime.co.ir/Services/Fut_Live_Loc_Service.asmx/GetContractInfo', json = data ).json()
print(r)

你可以做一个循环，例如：

import requests

codes = ['OSFKH98', 'OSFOR98','OSFTR98', 'SAFKH98','SAFOR98','SAFTR98']

with requests.Session() as s:
    for code in codes:
        data = {'ContractCode' : code}
        r = s.post('http://cdn.ime.co.ir/Services/Fut_Live_Loc_Service.asmx/GetContractInfo', json = data ).json()
        print(r)

示例r：

https://jsoneditoronline.org/?id=ec913bbb31164500900780c129e971f4

相关问题更多 >

编程相关推荐

热门问题

热门文章

如果我想得到这个网站上表格的内容，应该读什么HTML标签（网页抓取）

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >