Подберите строки, которые похожи, но различаются по стилю написания - PullRequest
0 голосов
/ 20 июня 2019

Я хочу знать, есть ли простой способ сопоставления строк, например, то есть MBA с магистром делового администрирования, M.B.A, M-B-A, MBA или Ms в Cs с мастерами в области компьютерных наук, или с Ms в области компьютерных наук, MS в (компьютерные науки) и т.д. Эти строки похожи друг на друга, но разные стили написания Я работаю над каким-то проектом CV, где я должен сопоставить обучение по месту работы с образованием, написанным в резюме кандидата, поэтому может быть случай, когда какое-то образование написано в jop post каким-то образом, и то же самое существует в cv с другим форматом, как в jop после того, как он нашел MBA и в cv нашел основателя в бизнес-администрировании, как мне с этим справиться? ....... заранее спасибо

1 Ответ

0 голосов
/ 20 июня 2019

Строковые паттерны обычно можно найти с помощью регулярных выражений (в python - пакет 're'), без примера вашего кода и структуры данных я мало что могу сделать, но группировка строк, таких как MBA, MBA или MBA, может быть легко осуществлена. сделано с помощью регулярных выражений

...