如何找到字符的双八卦图?

2024-04-20 04:28:17 发布

您现在位置:Python中文网/ 问答频道 /正文

问题:

我有一个数据集,我想用一些简单的方法来区分它们是否是dga域分类。所以我想用双曲线、三元组和熵来开始。在

我尝试了:

from nltk import ngrams
sentence = 'some big sentence'
n = 2
sixgrams = ngrams(sentence.split(), n)
for grams in sixgrams:
print grams

这里我有一个句子。但是我的目的不是这个。在

我想改变信仰

示例域:谷歌公司

^{pr2}$

然后计算二元曲线_分数。从我可以用它来预测模块和分析。在

有谁能帮我弄清楚怎么解决这个问题吗?在


Tags: 数据方法fromimport分类somesentence区分
1条回答
网友
1楼 · 发布于 2024-04-20 04:28:17
>>> from nltk import word_tokenize, ngrams
>>> s = "foo bar sentence"

# Word ngrams.
>>> list(ngrams(word_tokenize(s), 2))
[('foo', 'bar'), ('bar', 'sentence')]

# Character ngrams.
>>> list(ngrams(s, 2))
[('f', 'o'), ('o', 'o'), ('o', ' '), (' ', 'b'), ('b', 'a'), ('a', 'r'), ('r', ' '), (' ', 's'), ('s', 'e'), ('e', 'n'), ('n', 't'), ('t', 'e'), ('e', 'n'), ('n', 'c'), ('c', 'e')]

相关问题 更多 >