Python中的列表（使用NLTK）

with open('corpus.txt', 'r') as f: for line in f: cnt = 0 sa = nltk.word_tokenize(line) label[:] = [] for i in sa: words.append(i) if cnt>0: try: label +=[(prev , i)] except: NameError prev = i cnt = cnt + 1 if label != []: connection += [label] print connection

2条回答

网友

1楼 · 编辑于 2024-04-26 03:59:06

我没有安装NLTK，但是看看这个是否适合您：

with open('corpus.txt', 'r') as f:
    answer = []
    for line in f:
        cnt = 0
        sa = nltk.word_tokenize(line)
        answer.append([tuple([char, sa[i+1]]) for i,char in enumerate(sa[:-1])])

网友

2楼 · 编辑于 2024-04-26 03:59:06

您可以使用nltk.bigrams获得元组，而不必担心边界条件是否正确。如果words是一个句子中单词的列表，则可以得到

bigrams = nltk.bigrams(words)

编程相关推荐

java为什么运行按钮在Eclipse中不起作用？
java构造函数：实例变量是否为对象存储单独的值？
java使用jquery获取值
生产文件夹和源文件夹中的java单元测试
java递归问题这个解决方案正确吗？有更简单的解决方案吗？
java Android sqlite正在检索已选中中的行
javacom。谷歌。云数据存储。DatastoreException:请求缺少必需的身份验证凭据
java无法在Linux Ubuntu 12.04上运行maven2
在监视器的上下文中，被阻塞的线程在被notify（）调用唤醒后在何处继续执行？
安卓如何从游标获取Bool（Java SQLite）

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python中的列表（使用NLTK）

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >