获取括号之间的单个字符串

[LEVEL] [NAME]The Girder Guide! [/NAME] [AUTHOR]draworigami[/AUTHOR] [AUTHORLEVEL]11[/AUTHORLEVEL] [COUNTRY]CA[/COUNTRY] [ID]62784[/ID] [RATING]4[/RATING] [DATE]2021-05-11 23:08:35[/DATE] [PLAYCOUNT]33[/PLAYCOUNT] [WINCOUNT]28[/WINCOUNT] [STARS]0[/STARS] [COMMENTS]1[/COMMENTS] [/LEVEL]

3条回答

网友

1楼 · 编辑于 2024-05-18 23:41:35

使用正则表达式怎么样

import re
s = '[LEVEL][NAME]The Girder Guide![/NAME][AUTHOR]draworigami[/AUTHOR][AUTHORLEVEL]11[/AUTHORLEVEL][COUNTRY]CA[/COUNTRY][ID]62784[/ID][RATING]4[/RATING][DATE]2021-05-11 23:08:35[/DATE][PLAYCOUNT]33[/PLAYCOUNT][WINCOUNT]28[/WINCOUNT][STARS]0[/STARS][COMMENTS]1[/COMMENTS][/LEVEL]'
s = s.replace('/', '')
result = []
for e in re.findall(r"\][A-Za-z0-9 _.:,!'/$\-]+\[", s):
    result.append(e.replace('[', '').replace(']', ''))

结果

['The Girder Guide!',
 'draworigami',
 '11',
 'CA',
 '62784',
 '4',
 '2021-05-11 23:08:35',
 '33',
 '28',
 '0',
 '1']

网友

2楼 · 编辑于 2024-05-18 23:41:35

试试这个：

st = "[LEVEL][NAME]The Girder Guide![/NAME][AUTHOR]draworigami[/AUTHOR][AUTHORLEVEL]11[/AUTHORLEVEL][COUNTRY]CA[/COUNTRY][ID]62784[/ID][RATING]4[/RATING][DATE]2021-05-11 23:08:35[/DATE][PLAYCOUNT]33[/PLAYCOUNT][WINCOUNT]28[/WINCOUNT][STARS]0[/STARS][COMMENTS]1[/COMMENTS][/LEVEL]"

st = st.split("]")
for i in range(len(st)):
    st[i] = st[i].replace("[", "")
    st[i]= st[i].replace("/", "")

st = st[:-1]

print(st)

st变为-

['LEVEL', 'NAME', 'The Girder Guide!NAME', 'AUTHOR', 'draworigamiAUTHOR', 'AUTHORLEVEL', '11AUTHORLEVEL', 'COUNTRY', 'CACOUNTRY', 'ID', '62784ID', 'RATING', '4RATING', 'DATE', '2021-05-11 23:08:35DATE', 'PLAYCOUNT', '33PLAYCOUNT', 'WINCOUNT', '28WINCOUNT', 'STARS', '0STARS', 'COMMENTS', '1COMMENTS', 'LEVEL']

我所做的：

围绕]拆分字符串，以获得不带字符']'的字符串列表
只需从获得的列表中的字符串中分别删除字符[和/
跳过了最后一个字符，因为它是由于split而生成的空字符串

网友

3楼 · 编辑于 2024-05-18 23:41:35

这将返回[]到[]之间的所有文本：

from bs4 import BeautifulSoup

rml = """
[LEVEL]
    [NAME]The Girder Guide! [/NAME]
    [AUTHOR]draworigami[/AUTHOR]
    [AUTHORLEVEL]11[/AUTHORLEVEL]
    [COUNTRY]CA[/COUNTRY]
    [ID]62784[/ID]
    [RATING]4[/RATING]
    [DATE]2021-05-11 23:08:35[/DATE]
    [PLAYCOUNT]33[/PLAYCOUNT]
    [WINCOUNT]28[/WINCOUNT]
    [STARS]0[/STARS]
    [COMMENTS]1[/COMMENTS]
[/LEVEL]
"""

html = rml.replace('[', '<').replace(']', '>')
soup = BeautifulSoup(html, 'html.parser')
print(soup.find('level').text)

输出：

The Girder Guide! 
draworigami
11
CA
62784
4
2021-05-11 23:08:35
33
28
0
1

编辑#1:原始字符串没有换行符，因此要精确打印：

rml = "[LEVEL][NAME]The Girder Guide![/NAME][AUTHOR]draworigami[/AUTHOR][AUTHORLEVEL]11[/AUTHORLEVEL][COUNTRY]CA[/COUNTRY][ID]62784[/ID][RATING]4[/RATING][DATE]2021-05-11 23:08:35[/DATE][PLAYCOUNT]33[/PLAYCOUNT][WINCOUNT]28[/WINCOUNT][STARS]0[/STARS][COMMENTS]1[/COMMENTS][/LEVEL]"

html = rml.replace('[', '<').replace(']', '>')
soup = BeautifulSoup(html, 'html.parser')
elements = soup.find('level').contents
for e in elements:
    print(e.text)

相关问题更多 >

编程相关推荐

热门问题

热门文章

获取括号之间的单个字符串

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >