我有一个这样的数据集。 第一列是单词,第二列是标记
Pretty O bad O storm O here O last O evening O . O From O Green O Newsfeed O : O AHFA B-group extends O deadline O for O Sage O Award O to O Nov O . O
我想重建句子
所以输出会是
[[('Pretty', 'O'), ('bad', 'O'), ('storm','O'), ('here', 'O'), ('last', 'O'), ('evening', 'O'), ('.', 'B-geo')][(From, 'O'), ('Green', 'O'), ('Newsfeed', 'O'), ('storm:,'O'), ('AHFA', 'B-group'), ('extends', 'O'), ('deadline', 'O'), ('for', 'O'),('Sage', 'O'), ('Award', 'B-geo')][(to, 'O'), ('Nov', 'O'), ('.','O']]
有人能帮我把这个句子造出来吗
如果您有:
然后得到:
[('Pretty', 'O'), ('bad', 'O'), ('storm','O'), ('here', 'O'), ('last', 'O'), ('evening', 'O'), ('.', 'B-geo')]
你可以做:
然后可以对每个数据帧和元组列表中的所有元组执行此操作
如果你把所有的句子都放在一个数据框中,像这样:
您可以找到“”ie空间值的索引,并按如下方式拆分数据集:
最后你会有这样的事情:
相关问题 更多 >
编程相关推荐