У меня есть длинный список имен в электронной таблице, которую я использую в R. Есть несколько классических проблем с именами (корпоративных или частных лиц), таких как пример ниже.
DU PONT JEAN
DUPONT JEAN
DUPON T JEAN
DUPONT JEAN
DUPONT J
DU-PONT JEAN
DU POTN JEAN
Я пытаюсь исправить некоторые вещи, такие как пробелы между именами или взять только первую букву имени, но это не очень удовлетворительно.
Поскольку это очень распространенные проблемы, мне интересно, есть ли кусок кода или пакет для решения этой проблемы?