我正在尝试将包含两个值的最后一列以逗号分隔的形式转换为两个单独的列。请参阅输入和输出文件的最后几列以了解动机
下面是我的输入文件的样子:
fILENAME sent_no word POS lab,Slab
File_1 sentence:1 abc NNP B,NO
fhj PSP O,O
bmm NNP B,NO
vbn PSP O,O
vbn NN B,NO
vbn NNPC B,NO
. Sym O,O
File_1 Sentence:2 vbb NNP B,NO
bbn PSP B,NO
nnm NNP O,O
nnn PSP B,NO
bbn NN O,O
. Sym O,O
并输出输出文件我希望如下所示:
Filename sent_num word POS Label Slab
File_1 sentence:1 abc NNP B NO
fhj PSP O O
bmm NNP B NO
vbn PSP O O
vbn NN B NO
vbn NNPC B NO
. Sym O O
File_1 Sentence:2 vbb NNP B NO
bbn PSP B NO
nnm NNP O O
nnn PSP B NO
bbn NN O O
. Sym O O
我假设*.csv文件是
您可以使用csv读取和写入特定的分隔符csv文件
可以使用pandas将“逗号分隔”列分隔为两列
下面是一个数据帧示例
看起来像这样
然后可以将值转换为列表,然后再转换为序列
结果
试试这个:
但我使用多索引dataframe查看您的数据,因此我添加了以下内容:
结果是:
简单地说,您可以像这样使用多重分隔符:
相关问题 更多 >
编程相关推荐