我有一个嵌套列表:
output= [('the', 'B', 'NNP'), ('wall', 'I', 'NNP'), ('street', 'I', 'NNP'), ('journal', 'I', 'NNP'), ('reported', 'O', 'VB'), ('today', 'O', 'NNP'), ('that', 'O', 'NNP'), ('apple', 'B', 'NNP'), ('corporation', 'I', 'NNP'), ('made', 'O', 'VB'), ('money', 'O', 'NNP'), ('.', 'O', '.'), ('georgia', 'B', 'NNP'), ('tech', 'I', 'NNP'), ('is', 'O', 'NNP'), ('a', 'O', '.'), ('university', 'O', 'NNP'), ('in', 'O', 'NNP'), ('georgia', 'B', 'NNP'),('.', 'O', '.')]
我想将其重新格式化为以下预期格式:
new_output= [(['the', 'wall', 'street', 'journal', 'reported', 'today', 'that', 'apple', 'corporation', 'made', 'money'], ['B', 'I', 'I', 'I', 'O', 'O', 'O', 'B', 'I', 'O', 'O']), (['georgia', 'tech', 'is', 'a', 'university', 'in', 'georgia'], ['B', 'I', 'O', 'O', 'O', 'O', 'B'])]
我的尝试是:
import string
word = []
token = []
result_word = []
result_token = []
result = []
for i in output[0]:
for every_word in i:
word.append(every_word)
result_word = " ".join(" ".join(word).split()[::3])
如何获得预期格式?你知道吗
输出:
您可以使用^{} 将非句点项分组成句子,然后使用
zip
将词性指示符中的单词分开:res
就是这样你可以这样做:
输出
解释
据我所知,你想把每个句子的第一个和最后一个元素拆开。你知道吗
线路:
将
output
按每个.
拆分成句子,第二行只是将每个句子解包:当你想要一个列表的元组列表,zip返回一个元组列表时,你必须用list映射每个元组,然后将映射的结果转换成一个元组。你知道吗
相关问题 更多 >
编程相关推荐