У меня есть фрейм данных со столбцом с именами отдельных лиц:
name
Mr. Salmon
Mr Salmon
Ms. Salmon
Mrs. Salmon
Mrs Salmon
...
Я хотел бы удалить все Honififics. Я скомпилировал следующее регулярное выражение на regex101.com и подтвердил все совпадения.
(^[Mm]([Rr]|[Ss]|[Xx]|[Rr][Ss]|[Ii][Ss]+)\.?\s)|(^[Mm][Ii][Ss][Tt][Ee][Rr]\.?\s)|(^[Mm][Ii][Ss]+[Uu][Ss]\.?\s)
Я использую метод замены в именном фрейме данных, чтобы удалить совпадения с ничем. Я использую следующий код:
names_nohf = names.replace(r'(^[Mm]([Rr]|[Ss]|[Xx]|[Rr][Ss]|[Ii][Ss]+)\.?\s)|(^[Mm][Ii][Ss][Tt][Ee][Rr]\.?\s)|(^[Mm][Ii][Ss]+[Uu][Ss]\.?\s)', regex = True)
Это, однако, не возвращает нужные имена и фактически не вносит никаких изменений. Может ли кто-нибудь указать мне правильное направление?