将NLTK标记器输出保存到CSV fi

2024-06-16 13:14:11 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图分析一个文本来找到所有的'NN'和'nnp',到目前为止,代码运行良好,但是当我将输出保存到CSV文件时,我无法获得我想要的格式。这个问题,已经分析了,这个词-

代码如下:

training_set = []

text = 'I want to analized this text'
tokenized = nltk.word_tokenize(text)
tagged = nltk.pos_tag(tokenized)
result= [(word, tag) for word, tag in tagged if tag in ('NN', 'NNP')]

for i in result:
    training_set.append(i)
    training_set.append([text])
    print(training_set)

listFile2 = open('sample.csv', 'w', newline='')
writer2 = csv.writer(listFile2,quoting=csv.QUOTE_ALL, lineterminator='\n', delimiter=',')
for item in training_set:
    writer2.writerow(item)

结果如下:

enter image description here

你知道我怎样才能把所有的信息保持在同一条线上吗。像这样:

enter image description here

我已经更改了代码并使用了两个列表,然后使用Zip将这两个列表都添加到CSV文件中,但是这似乎是有效的,都接近于“”和()

^{pr2}$

结果:

enter image description here


Tags: 文件csv代码textinfortagtraining
1条回答
网友
1楼 · 发布于 2024-06-16 13:14:11

在将数据写入csv之前,您可以尝试类似的方法以获得所需格式的数据:

[tag + (text,) for tag in result]

输出:

^{pr2}$

它本质上会以您需要的格式给您一个元组列表,然后您可以将其写入csv。在

相关问题 更多 >