Какие популярные методы поиска и замены составных слов, такие как:
brokenleg -> (broken,leg)
Метод должен выполняться на тысячах строк, не зная заранее, есть ли там конкатенированные слова.
Я использую библиотеку SpaCy для большей части моей обработки строк, поэтому лучшим методом будет тот, который хорошо работает вместе с SpaCy.