对beautifulsoup中缺少字段的错误处理

1条回答

网友

1楼 · 发布于 2024-04-26 13:59:00

创建一个函数，尝试查找文本，并返回一个字符串错误消息，而不是引发错误。你知道吗

def safe_find(element, text, error_message):
    try:
        return element.find(text=re.compile(text))
    except:
        return error_message

然后可以使用此函数检索可能缺少的字段，而不需要任何内联try except子句。你知道吗

address = safe_find(house, '[0-9]{4}[ ]?[azAZ]{2}', "ERR No Address")

编辑：您可以使函数稍微更具可扩展性，接受find可以接受的任何参数：

def safe_find(element, error_message, *args, **kargs):
    try:
        return element.find(*args, **kargs)
    except:
        return error_message

safe_find(house, "ERR No Address", text=re.compile('[0-9]{4}[ ]?[azAZ]{2}'))
safe_find(house, "ERR no street", "a", class_='object-street')
safe_find(house, "ERR no street", "a", class_='object-street')
safe_find(house, "ERR no number", 'span', title=re.compile('Number of'))
safe_find(house, "ERR no WaitingFor", "span", title="WaitingFor")

。。。但是您不能使用它来访问任何属性，例如text或attrs['href']。你知道吗

编辑：您可以创建一个特殊的对象，其中包含一条错误消息，用于您可能要访问的所有属性。你知道吗

import collections
def safe_find(element, error_message, *args, **kargs):
    class FakeResult:
        def __init__(self, err):
            self.attrs = collections.defaultdict(lambda: err)
            self.text = err
            #todo: add other attributes here, like:
            #self.whatever = err
    try:
        return element.find(*args, **kargs)
    except:
        return FakeResult(error_message)

safe_find(house, "ERR no street", "a", class_='object-street').text
safe_find(house, "ERR no street", "a", class_='object-street').attrs['href']
safe_find(house, "ERR no number", 'span', title=re.compile('Number of')).text
safe_find(house, "ERR no WaitingFor", "span", title="WaitingFor").text

但是，只有当您要访问text或attrs属性时，这个才有效。safe_find(house, "ERR No Address", text=re.compile('[0-9]{4}[ ]?[azAZ]{2}'))后面没有.text或.attrs["stuff"]，它将为您提供一个FakeResult实例，而不是一个字符串。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

对beautifulsoup中缺少字段的错误处理

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >