我试着用Flairhttps://github.com/flairNLP/flair对印度尼西亚语的句子列表进行词性标注
结果是list
,名称为pos
:
['Sejarah <NOUN> perkembangan <NOUN> ilmu <NOUN> ekonomi <NOUN> Adam <PROPN> Smith <PROPN> sering <ADV> disebut <VERB> sebagai <ADP> yang <PRON> pertama <NUM> mengembangkan <VERB> ilmu <NOUN> ekonomi <NOUN> pada <ADP> abad <NOUN> 18 <NUM> sebagai <ADP> satu <DET> cabang <NOUN> tersiri <NOUN> dalam <ADP> ilmu <NOUN> pengetahuan <NOUN>', 'Melalui <ADP> karya <NOUN> besarnya <NOUN> General <PROPN> Theory <PROPN> Employment <PROPN> Interest <PROPN> and <PROPN> Money <PROPN> yang <PRON> menyatakan <VERB> bahwa <SCONJ> pasar <NOUN> tidak <PART> selalu <ADV> mampu <ADV> menciptakan <VERB> keseimbangan <NOUN> dan <CCONJ> karena <SCONJ> itu <DET> intervensi <NOUN> pemerintah <NOUN> harus <ADV> dilakukan <VERB> agar <SCONJ> distribusi <NOUN> ber <VERB> daya <NOUN> mencapai <VERB> sasarannya <NOUN>']
我想将该列表转换为dataframe,如下所示:
Text Label
0 Sejarah NOUN
1 perkembangan NOUN
2 ilmu NOUN
3 ekonomi NOUN
4 Adam PROPN
5 Smith PROPN
6 sering ADV
7 disebut VERB
8 sebagai ADP
9 yang PRON
10 pertama NUM
... ... ...
... ... ...
我试过:
df = pd.DataFrame(pos, columns=['Text', 'Label'])
但我有一个错误:
ValueError: Shape of passed values is (6921, 1), indices imply (6921, 2)
我的代码怎么了
你可以做:
对于字符串列表,您可以执行以下操作:
相关问题 更多 >
编程相关推荐