获取AttributeError:“NoneType”对象没有getTex属性

2024-04-19 23:24:08 发布

您现在位置:Python中文网/ 问答频道 /正文

我已经写了一半的代码从RSS提要中提取标题和链接,但这会导致上面的错误。获取文本时,两个函数都出错。我想去掉输入的标题和链接标签的字符串。

from bs4 import BeautifulSoup
import urllib.request
import re

def getlink(a):
    a= str(a)
    bsoup=BeautifulSoup(a)
    a=bsoup.find('link').getText()
    return a

def gettitle(b):
    b=str(b)
    bsoup=BeautifulSoup(b)
    b=bsoup.find('title').getText()
    return b

webpage= urllib.request.urlopen("http://feeds.feedburner.com/JohnnyWebber?format=xml").read()

soup=BeautifulSoup(webpage)
titlesoup=soup.findAll('title')
linksoup= soup.findAll('link')

for i,j in zip(titlesoup,linksoup):
    i = getlink(i)
    j= gettitle(j)

    print (i)
    print(j)
    print ("\n")

编辑:falsetru的方法非常有效。

我还有一个问题。只需执行getText,就可以从任何标记中提取文本吗?


Tags: 文本import标题链接requestdeffindurllib