Я пытаюсь найти человеческое имя из кадра данных. У меня есть очень большой набор данных, в котором мне нужно маркировать каждое слово, но имена людей должны быть полными. Я просто создаю это в качестве примера.
Date Text
09.05.2019 His name is Detlef Schubert.
04.09.2019 Mr. Klau Gerd is a good person.
Итак, я хочу вывод, как это:
Date Text
09.05.2019 His
09.05.2019 name
09.05.2019 is
09.05.2019 Detlef Schubert
04.09.2019 Mr. Klaus Gerd
04.09.2019 is
04.09.2019 a
04.09.2019 good
04.09.2019 person.
Пока я делаю это:
df = df.set_index('Date')['Text'].str.split().explode()
Но я хочу полное имя, когда я делаю токенизацию