用于跟踪话语语境和预测未来特征的模型。
dictionary-model的Python项目详细描述
要使用,请首先创建charpredictor对象:
>>> predictor = CharPredictor()
下载和加载模型可能需要一段时间。
然后,要跟踪话语上下文,可以将字母索引添加到上下文:
>>> letter_index = 1 # 1 -> a, letters should be indexed in order: ' abcdefghijklmnopqrstuvwxyz' (0 -> space) >>> predictor.add_to_context(letter_index)
或者您可以将字母添加为长度为1的字符串(确保它是asciiencoder.available\u chars之一):
>>> letter = 'a' >>> predictor.add_to_context(letter)
或者您可以为所有asciiencoder添加概率分布。可用字符字母:
>>> import numpy as np >>> import AsciiEncoder as AE >>> >>> num_chars = len(AE.AVAILABLE_CHARS) >>> letter_distr = np.random.random((1, num_chars)) # random proba distribution >>> predictor.add_to_context(letter_distr)
最后,您可以预测每个字母在上下文中存储的文本之后出现的概率。(字母按如下顺序编入索引):
>>> predictor.transform()
字母顺序:
' abcdefghijklmnopqrstuvwxyz' # space character comes at index 0, then alphabetical order for indices from 1 to 26