将NLTK标记器输出保存到CSV fi

2024-06-16 13:14:11 发布

您现在位置：Python中文网/ 问答频道 /正文

569

网友

男 | 程序猿一只，喜欢编程写python代码。

我试图分析一个文本来找到所有的'NN'和'nnp'，到目前为止，代码运行良好，但是当我将输出保存到CSV文件时，我无法获得我想要的格式。这个问题，已经分析了，这个词-

代码如下：

training_set = []

text = 'I want to analized this text'
tokenized = nltk.word_tokenize(text)
tagged = nltk.pos_tag(tokenized)
result= [(word, tag) for word, tag in tagged if tag in ('NN', 'NNP')]

for i in result:
    training_set.append(i)
    training_set.append([text])
    print(training_set)

listFile2 = open('sample.csv', 'w', newline='')
writer2 = csv.writer(listFile2,quoting=csv.QUOTE_ALL, lineterminator='\n', delimiter=',')
for item in training_set:
    writer2.writerow(item)

结果如下：

你知道我怎样才能把所有的信息保持在同一条线上吗。像这样：

我已经更改了代码并使用了两个列表，然后使用Zip将这两个列表都添加到CSV文件中，但是这似乎是有效的，都接近于“”和（）

^{pr2}$

结果：

Tags：文件 csv 代码 text in for tag training

1条回答

网友

1楼 · 发布于 2024-06-16 13:14:11

在将数据写入csv之前，您可以尝试类似的方法以获得所需格式的数据：

[tag + (text,) for tag in result]

输出：

^{pr2}$

它本质上会以您需要的格式给您一个元组列表，然后您可以将其写入csv。在

将NLTK标记器输出保存到CSV fi

相关问题更多 >

编程相关推荐

热门问题

热门文章

将NLTK标记器输出保存到CSV fi

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >