从文本文件建立马尔可夫模型?

2024-04-26 15:11:07 发布

您现在位置:Python中文网/ 问答频道 /正文

我的任务是建立一个程序,根据输入文件,读取文本,然后生成新的文本。字典应该根据输入文件中的文本,将n个字母字符串映射到可以跟随该字符串的字母列表。到目前为止,我已经

def create_dic():
    n = order_entry.get()
    inputfile = file_entry.get() #name of input file
    lines = open(inputfile,'r').read() #reads input file into string
    model = {} #empty dictionary to build Markov model

对于输入中的每一个n字符序列,我必须“在字典中查找它以获得可能的后续字符列表并获得下一个字符”。我对字典开始为空时在字典中查找字符串的指令感到困惑?字典里不是什么都没有吗?你知道吗


Tags: 文件字符串文本程序列表inputgetmodel
2条回答

这绝对不是最好的方法,但你要从这个开始。你知道吗

  • 字母基础:哪个字母排在第一位(对于整个数据)。你知道吗

单词的第一个字符(字母)是可数实体。检查哪个字符(字母)记录最多是合理的。用这个开始你生成的文本。然后看看哪个字母最接这个等等。另外,取平均单词长度,并将生成的单词分布在这个长度上。你知道吗

为了获得更好的结果:

  • 在n格基础上:哪个n格最有可能在其他n格之前(你也可以把它扩展成句子)

因为这是一个作业,我将给你引导性的问题,而不是一个答案。正如@Quirliom所说,“填充字典。”

当您想使用马尔可夫模型时,您希望在字典中搜索哪个键?你知道吗

当你搜索那把钥匙时,你想取回什么?你知道吗

“字典应该根据输入文件中的文本,将n个字母串映射到一个可以跟在该字符串后面的字母列表”这句话回答了这些问题。这意味着您必须对输入文件做一些工作,以确定如何提取字典键以及它们应该映射到什么。你知道吗

相关问题 更多 >