如何读取和比较以utf8格式保存的文件的单行中的不同单词？在python中？

2条回答

网友

1楼 · 编辑于 2024-06-16 13:35:23

此函数将读取一行并打印所有单词。它使用空格（\s）的正则表达式拆分行，并使用enumerate函数添加索引。你知道吗

def read_words(file_name):
    with open(file_name, "r", encoding="UTF8") as read_language:
        line = read_language.readline()
        for idx, word in enumerate(re.split(r"\s", line)):
            print (idx, word)

您可以使用yield将其升级为生成器：

def read_words(file_name):
    with open(file_name, "r", encoding="UTF8") as read_language:
        line = read_language.readline()
        for idx, word in enumerate(re.split(r"\s", line)):
            yield (idx, word)

您可以在for循环中添加compare函数，并对单词执行您想要的任何逻辑。你知道吗

网友

2楼 · 编辑于 2024-06-16 13:35:23

    read_language = open(X, "r", encoding='UTF8')#X and Y are predefined filenames 
    output_file = open(Y, "w", encoding='UTF8') 
    T=read_language.readline()
    for idx, word in enumerate(re.split(r"\s", T)):
        print (idx, word)
        if idx==2:
            print(word)
            output_file.write(word)
   read_language.close()
   output_file.close()

对于我来说，即使是utf-8（unicode）格式的特定索引也是如此

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何读取和比较以utf8格式保存的文件的单行中的不同单词？在python中？

对于我来说，即使是utf-8（unicode）格式的特定索引也是如此

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >