我的任务是建立一个程序,根据输入文件,读取文本,然后生成新的文本。字典应该根据输入文件中的文本,将n个字母字符串映射到可以跟随该字符串的字母列表。到目前为止,我已经
def create_dic():
n = order_entry.get()
inputfile = file_entry.get() #name of input file
lines = open(inputfile,'r').read() #reads input file into string
model = {} #empty dictionary to build Markov model
对于输入中的每一个n字符序列,我必须“在字典中查找它以获得可能的后续字符列表并获得下一个字符”。我对字典开始为空时在字典中查找字符串的指令感到困惑?字典里不是什么都没有吗?你知道吗
这绝对不是最好的方法,但你要从这个开始。你知道吗
单词的第一个字符(字母)是可数实体。检查哪个字符(字母)记录最多是合理的。用这个开始你生成的文本。然后看看哪个字母最接这个等等。另外,取平均单词长度,并将生成的单词分布在这个长度上。你知道吗
为了获得更好的结果:
因为这是一个作业,我将给你引导性的问题,而不是一个答案。正如@Quirliom所说,“填充字典。”
当您想使用马尔可夫模型时,您希望在字典中搜索哪个键?你知道吗
当你搜索那把钥匙时,你想取回什么?你知道吗
“字典应该根据输入文件中的文本,将n个字母串映射到一个可以跟在该字符串后面的字母列表”这句话回答了这些问题。这意味着您必须对输入文件做一些工作,以确定如何提取字典键以及它们应该映射到什么。你知道吗
相关问题 更多 >
编程相关推荐