Удалите имена пользователей из комментариев YouTube с пандами данных. - PullRequest
0 голосов
/ 11 июля 2019

У меня есть набор комментариев Youtube, который я обрабатываю с помощью python. Я хочу выполнить некоторую предварительную обработку и удалить имена пользователей из комментариев, которые являются ответами на другие комментарии. Имена пользователей всегда находятся в начале текста. У меня есть все уникальные имена пользователей в списке. Моя проблема в том, что иногда имена пользователей появляются с символом @ в начале текста, а иногда без него.

Я пытаюсь сделать что-то подобное, но я в замешательстве:

для автора в unique_authors:

Dataframe['column_name'].replace(to_replace='@'+author, value='', regex=True)
Dataframe['column_name'].replace(to_replace=author, value='', regex=True)

Это некоторые примеры имен пользователей, я изменил некоторые буквы с помощью символа '#' по соображениям конфиденциальности.

['S###r Puma',
 'd####tdr###n R###l DD R##ue',
 'kostas .l###as',
 'Hans L###ent##s',
 'Kwstas S##o',...]

Мои комментарии выглядят так:

S###r Puma \n\nΑααα\n\nΟοοοοορτσαααα...

@d####tdr###n R###l DD R##ue Η FANT KORAKLA Π...    

Я бы хотел, чтобы результаты выглядели так:

\n\nΑααα\n\nΟοοοοορτσαααα...

Η FANT KORAKLA Π...
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...