Я попытался удалить все [.!?]
из кавычек в тексте, и поэтому я хочу сначала перехватить все мои цитаты, включая [.!?]
, с помощью регулярного выражения, чтобы удалить их после этого.
Мое регулярное выражение не работает, возможно, потому что оно жадное.Это занимает от моего «« »(символ с индексом 569) до последнего символа, который является другим« »» (символ с индексом 2730).
Мое регулярное выражение было:
Pattern full=Pattern.compile("«.*[.!?].*?»");
Matcher mFull = full.matcher(result);
while(mFull.find()){
System.out.println(mFull.start()+" "+mFull.end());
}
ИтакЯ получил:
569 2731
Кроме того, та же проблема жадности, с ловкими предложениями (начиная с любого [AZ] и заканчивая любым [.!?].