从fi获取并格式化字符串

import re def main(): padrao = r'"id"\w+' caminho = 'D:\index.txt' arquivo = open(caminho,'r') texto = arquivo.readlines()[1].split('{') textoEncontrado = texto[2].split(',') print textoEncontrado[0] print textoEncontrado[1] arquivo.close() if __name__ == '__main__': main()

1条回答

网友

1楼 · 发布于 2024-04-26 23:07:45

如果您的输入是包含json文本的有效html：

>>> from bs4 import BeautifulSoup
>>> html = """<p>Any text, bla bla lorem ipsum, bla bla</p>
... <p>test = {"player":{"id":"123123","name":"f_teste"}};"""
>>> soup = BeautifulSoup(html)
>>> import  re
>>> jsonre = re.compile(r'test\s*=\s*(.*);', re.DOTALL)
>>> p = soup('p', text=jsonre)[0]
>>> json_text = jsonre.search(p.get_text()).group(1)
>>> import json
>>> json.loads(json_text)
{u'player': {u'id': u'123123', u'name': u'f_teste'}}

要安装bs4，请运行：pip install beautifulsoup4。你知道吗

正则表达式解决方案如下所示：

>>> re.findall(r'"(id)":"([^"]*)","(name)":"([^"]*)"', html)
[('id', '123123', 'name', 'f_teste')]

相关问题更多 >

编程相关推荐

热门问题

热门文章

从fi获取并格式化字符串

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >