Мне всегда очень не нравился тип переноса слов в вашем примере: Projektplanung und -überwachung
.:-( Поэтому, хотя я согласен с Дж. Б. Низетом, что без списка или словаря простых несоставных существительных невозможно узнать, может быть, есть способ сделать интеллектуальное предположение на немецком языкепо крайней мере. Давайте воссоединим Projekt и -überwachung!
Вы можете создать список из согласных кластеров и отметить, где эти кластеры делятся. Например, ktpl в первомслово пары поделилось бы так: kt-pl. Geschwindigkeitsbegrenzung имеет tsb
, который делит ts-b. Я не думал об этом до конца - и дополнительные метаданные могут быть необходимы.
Алгоритм найдет наиболее «центрально» расположенный кластер согласных в слове, например, он будет игнорировать «schw» и «nd», «gr» и «nz» и искать «tsb» в Geschwindigkeitsbegrenzung .