我很难得到正确的代码来解析出这本电子书的章节,然后有27章打印到自己的文本文件。我得到的最多的是打印“CHAPTER-1.txt”。我不想硬编码任何东西,我不知道我已经完全错过了标记。你知道吗
infile = open('dracula.txt', 'r')
readlines = infile.readlines()
toc_list = readlines[74:185]
toc_text_lines = []
for line in toc_list:
if len(line) > 1:
stripped_line = line.strip()
toc_text_lines.append(stripped_line)
#print(len(toc_text_lines))
chaptitles = []
for text_lines in toc_text_lines:
split_text_line = text_lines.split()
if split_text_line[-1].isdigit():
chaptitles.append(text_lines)
#print(len(chaptitles))
print(chaptitles)
infile.close()
import re
with open('dracula.txt') as f:
book = f.readlines()
while book:
line = book.pop(0)
if "CHAPTER" in line and book.pop(0) == '\n':
for title in chapters_names_list: ['CHAPTER I.', 'CHAPTER II.',
'CHAPTER III.']
with open("{}.txt".format(chapters_names_list), 'w') :
我认为你可以受益于发电机,假设其中一本电子书太大,无法放入内存,你会有一些问题。你知道吗
你能做的是构造一种数据处理管道,首先查找文件(电子书.txt)在文件系统中,我们需要记住,我们需要所有的函数都尽可能的通用,一旦我们有了文件名,我们打开它,一次产生一行,最后我们扫描每一行的“第一章”,“第二章”,等等
您可以在这些实现的基础上进行构建,以完成您要做的事情。你知道吗
如果这有帮助,请告诉我。你知道吗
相关问题 更多 >
编程相关推荐