Если у меня есть строка типа
"Это строка, которая будет разделена на это и что"
Я хотел бы получить результаты разделения как
- "- это строка, которая будет разделена на"
- "и что"
- "это строка"
- "будетделится на это и "
1 и 2 делятся на" это "3 и 4 делятся на" то "
Мое решение - использовать карту строки для хранения и хранениярезультат в другой карте той же строки типа в строку.Однако для более сложного и более длинного текста результаты, сохраненные на карте, повторяются, то есть, как в приведенных выше 1 и 3, повторяется подстрока «является строкой», и эта избыточность дает неверные статистические результаты.Не могли бы вы предложить более удачное решение для токенизации длинной строки с разделителями, которые являются разными длинными строками?