我试图从数据框中搜索人名。我有一个非常大的数据集,我需要标记everyword,但人名应该是全名。我只是举个例子
Date Text
09.05.2019 His name is Detlef Schubert.
04.09.2019 Mr. Klau Gerd is a good person.
所以我想要这样的输出:
Date Text
09.05.2019 His
09.05.2019 name
09.05.2019 is
09.05.2019 Detlef Schubert
04.09.2019 Mr. Klaus Gerd
04.09.2019 is
04.09.2019 a
04.09.2019 good
04.09.2019 person.
到目前为止,我正在这样做:
df = df.set_index('Date')['Text'].str.split().explode()
但我做标记化时需要全名
目前没有回答
相关问题 更多 >
编程相关推荐