用scrapy访问嵌套标记中的类名

2024-06-02 07:14:37 发布

您现在位置:Python中文网/ 问答频道 /正文

我有以下文件

    <p class="contact-info " onclick="_ct('clntphn', 'lspg');">
    <i class="res_contactic resultimg"></i>
    <span>
        <a>
            <b>
                <span class="mobilesv icon-dc"></span>
                <span class="mobilesv icon-fe"></span>
                <span class="mobilesv icon-ji"></span>
                <span class="mobilesv icon-yz"></span>
                <span class="mobilesv icon-hg"></span>
                <span class="mobilesv icon-ba"></span>
                <span class="mobilesv icon-ji"></span>
                <span class="mobilesv icon-yz"></span>
                <span class="mobilesv icon-rq"></span>
                <span class="mobilesv icon-wx"></span>
                <span class="mobilesv icon-ts"></span>
                <span class="mobilesv icon-rq"></span>
                <span class="mobilesv icon-vu"></span>
                <span class="mobilesv icon-ji"></span>
                <span class="mobilesv icon-vu"></span>
                <span class="mobilesv icon-po"></span>
            </b>
        </a>
    </span>
</p>

我有一个python字典,它将跨类名称映射到数字。例如:

^{pr2}$
  1. 如何使用scrapy访问这些嵌套标记中的类名并获取联系信息?在

Tags: 文件infocontactclassiconrqspanct
1条回答
网友
1楼 · 发布于 2024-06-02 07:14:37

尝试:response.css(span span::attr(class)).extract() 这将返回span类的列表作为['mobilesv icon-dc', 'mobilesv icon-fe', ...] 迭代列表,在space上拆分,获取第二个属性并从dict中找到内容

希望这就是你的要求,否则让我知道。在

谢谢。在

相关问题 更多 >