Python：解析tex时如何使用%%%

网友

1楼 · 编辑于 2024-06-09 21:09:48

import urllib.request

url = 'http://www.gutenberg.org/cache/epub/1342/pg1342.txt'
book = urllib.request.urlopen(url)
lines = book.readlines()
book.close()



import re

title_regex = re.compile(b'\*{3} START OF THIS PROJECT GUTENBERG EBOOK (.*?) \*{3}')

for index, line in enumerate(lines):
    match = title_regex.match(line)

    if match:
        book_name = match.group(1)
        print(book_name)

网友

2楼 · 编辑于 2024-06-09 21:09:48

Regex是一条出路：

import re

title_regex = re.compile(r'\*{3} START OF THIS PROJECT GUTENBERG EBOOK (.*?) \*{3}')

for index, line in enumerate(finalLines):
    match = title_regex.match(line)

    if match:
        book_name = match.group(1)
        print(index, book_name)

也可以逐行解析：

^{pr2}$

网友

3楼 · 编辑于 2024-06-09 21:09:48

最简单的解决方案：

sp = line.split()
if sp[:7]+sp[-1:] == '*** START OF THIS PROJECT GUTENBERG EBOOK ***'.split():
    bookname = ' '.join(sp[7:-1])

一个更好的解决方案将使用正则表达式，正如建议的那样。在

如果使用字节，则应使用b'*** START OF THIS PROJECT GUTENBERG EBOOK ***'，或对任何字节字符串使用bytes.decode(s)。在

您的代码段（带有urlopen()部分）可能如下所示：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python：解析tex时如何使用%%%

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >