Считайте этот текст параграфом
Группы по сохранению называют 20-летний запрет важнейшей защитой американской иконы.Горнодобывающая промышленность и некоторые республиканские члены Конгресса говорят, что это наносит ущерб экономике Аризоны и энергетической независимости страны. «Несмотря на значительное давление со стороны горнодобывающей промышленности, президент и секретарь Салазар не отступили», - сказала Джейн Дановитц, директор государственных земель США.для Pew Environment Group.
В приведенном выше предложении легко разбить предложения по периоду (.), но это приведет к неверным результатам при обработке периода в США.Предположим, у меня есть список сокращений, таких как
String abbrev[] ={"u.s.a", "u.a.e", "u.k", "p.r.c","u.s.s.r", };
String regex= "\\.";
Pattern pattern = Pattern.compile(regex,Pattern.CASE_INSENSITIVE);
Matcher matcher = pattern.matcher(sx);
int beginIndex=0;
// Check all occurance
int index=0;
while (matcher.find()) {
System.out.print("Start index: " + matcher.start());
System.out.print(" End index: " + matcher.end() + " ");
String group=matcher.group();
System.out.println("group: " + group);
int dotIndex= group.indexOf(".");
String sub= sx.substring(beginIndex, matcher.start()+dotIndex);
beginIndex= matcher.start()+dotIndex;
System.out.println(sub);
}
. Я мог бы сделать грубое силовое сопоставление со всеми сокращениями вокруг dotIndex.Есть ли лучший подход?