在python2中,如何限制从目录导入所有txt文件的字符串长度?比如字长=6000
import glob
raw_text = ""
path = "/workspace/simple/*.txt"
for filename in glob.glob(path):
with open(filename, 'r') as f:
for line in f:
raw_text += line
words = raw_text.split()
print(words)
此代码仅输入所有txt文件并在屏幕上打印。如何将其限制为6000字并且只打印6000字?你知道吗
这取决于你对一个词的定义。如果只是用空格隔开的文本,那就相当简单了:当单词经过时数一数,当你有足够的单词时就停下来。例如:
如果您希望精确6000个单词,可以修改循环,从最后一行中获取足够的单词,使其精确到6000个单词。你知道吗
如果你想让它更有效一点,那么把原始文本放到循环中,一行一行地构建单词
在这种情况下,您将要使用len(行单词)进行检查。你知道吗
假设你想从每个文件中得到6000个或更少的单词?你知道吗
您还可以为要归档的单词设置词典:
如果你只想要有字数的文件
相关问题 更多 >
编程相关推荐