我在用靓汤4刮网页。我一路找到我需要的内容
>>> for t in td: _CAT.append(t.renderContents())
>>> _CAT
[b'THE OLD TESTAMENT', b'SEAN SONG', b'CITY WALK', b'SLOGANEERING', b'ROOM', b'"BOARD"', b'WORLD HISTORY', b'SPIRITED CINEMA', b'TRANSPORTATION', b'FISH, BIRD, OR MAMMAL', b'PRUFROCKIAN PONDERINGS', b'YOU GET AN "A"', b'COMIC BOOKS']
是否仍要删除每个项中的b“”?你知道吗
我试过使用
>>> name_one = _CAT[0][2:]
>>> name_one
b'E OLD TESTAMENT'
但正如您所见,它从粗体标记的实际内容中删除了前2个字母。你知道吗
我也试过用
>>> _CAT[0].renderContents()
这导致了一个可以理解的错误。你知道吗
Traceback (most recent call last):
File "<input>", line 1, in <module>
AttributeError: 'bytes' object has no attribute 'renderContents'
我怎样才能只得到粗体标签的内容,例如b'[content]'?你知道吗
答案证明:
>>> for s in _CAT: names.append(s.decode('utf-8'))
>>> names
['THE OLD TESTAMENT', 'SEAN SONG', 'CITY WALK', 'SLOGANEERING', 'ROOM', '"BOARD"', 'WORLD HISTORY', 'SPIRITED CINEMA', 'TRANSPORTATION', 'FISH, BIRD, OR MAMMAL', 'PRUFROCKIAN PONDERINGS', 'YOU GET AN "A"', 'COMIC BOOKS']
“b”表示列表项是byte strings。您可以使用
相关问题 更多 >
编程相关推荐