Вы не можете решить это с помощью простого разделителя. Вам понадобится словарь известных сокращений, а затем пропустите точки после известного сокращения.
Я думаю, что было бы проще сначала прочитать содержимое всего файла в String
или StringBuffer
, затем искать точки (.
), посмотреть, есть ли одна из известных аббревиатур перед точка и если не копировать часть из последнего в текущий разделитель. Тем не менее, существует проблема распознавания предложения, которое заканчивается разделителем ...