Поскольку вы хотите считать частичные слова, вам понадобится список слов с возможными словами. Затем вы сначала разбиваете текст на слова на основе разделения пробелов, просматриваете все слова и пытаетесь найти максимально длинное совпадение подстроки со списком слов . Конечно, это будет очень, очень медленно, если список слов большой, но, возможно, вы можете ускорить сопоставление, используя массив суффиксов слова, которое вы просматриваете.
Если вы не нашли подходящей подстроки, просто посчитайте все слово как одно.
Надеюсь, вы понимаете мою идею. Это не так здорово, но это решение, которое я могу предложить для ваших требований.