如何在数据框中搜索人名?

2024-05-23 13:39:28 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图从数据框中搜索人名。我有一个非常大的数据集,我需要标记everyword,但人名应该是全名。我只是举个例子

Date                             Text
09.05.2019                       His name is Detlef Schubert. 
04.09.2019                       Mr. Klau Gerd is a good person. 

所以我想要这样的输出:

Date                             Text
09.05.2019                       His
09.05.2019                       name
09.05.2019                       is
09.05.2019                       Detlef Schubert
04.09.2019                       Mr. Klaus Gerd
04.09.2019                       is
04.09.2019                       a
04.09.2019                       good 
04.09.2019                       person.

到目前为止,我正在这样做:

df = df.set_index('Date')['Text'].str.split().explode()

但我做标记化时需要全名


Tags: 数据textname标记dfdateisperson