У меня есть набор комментариев Youtube, который я обрабатываю с помощью python. Я хочу выполнить некоторую предварительную обработку и удалить имена пользователей из комментариев, которые являются ответами на другие комментарии. Имена пользователей всегда находятся в начале текста. У меня есть все уникальные имена пользователей в списке. Моя проблема в том, что иногда имена пользователей появляются с символом @ в начале текста, а иногда без него.
Я пытаюсь сделать что-то подобное, но я в замешательстве:
для автора в unique_authors:
Dataframe['column_name'].replace(to_replace='@'+author, value='', regex=True)
Dataframe['column_name'].replace(to_replace=author, value='', regex=True)
Это некоторые примеры имен пользователей, я изменил некоторые буквы с помощью символа '#' по соображениям конфиденциальности.
['S###r Puma',
'd####tdr###n R###l DD R##ue',
'kostas .l###as',
'Hans L###ent##s',
'Kwstas S##o',...]
Мои комментарии выглядят так:
S###r Puma \n\nΑααα\n\nΟοοοοορτσαααα...
@d####tdr###n R###l DD R##ue Η FANT KORAKLA Π...
Я бы хотел, чтобы результаты выглядели так:
\n\nΑααα\n\nΟοοοοορτσαααα...
Η FANT KORAKLA Π...