(Python) sgmlparser及如何提取标签间数据,而非属性/值

3 投票
1 回答
697 浏览
提问于 2025-04-15 18:27

我看到的每个关于sgmlparser的例子都是在找一个标签,然后再找这个标签的属性和数值。比如说,我想提取出'google.com'。但是我其实想要的是标签之间的数据。所以如果我用sgmlparser,我会寻找这个标签,然后提取出这个div里面的所有内容,直到它的结束标签。请问sgmlparser是做这个的吗,还是我用错了库?

1 个回答

1

因为你提到了div,我猜测你是想解析HTML。要做到这一点,最好的选择是BeautifulSoup

撰写回答