Python идентифицирует неправильно отформатированные двойные имена - PullRequest
0 голосов
/ 11 марта 2020

Я пытаюсь очистить некоторые данные, используя Python. Как я могу найти, а затем исправить неправильно введенные двойные имена. Например: «Смит-Джонс», «Смит-Джонс», «Смит-Джонс» ... должны быть заменены на «Смит-Джонс». Цитаты можно игнорировать. Я могу удалить пробелы, используя re.sub (), а затем, возможно, другое регулярное выражение, но я бы хотел сделать все это за один go, если это возможно.

...