Я использую этот метод для разделения текста:
String[] parts = sentence.split("[,\\s\\-:\\?\\!\\«\\»\\'\\´\\`\\\"\\.\\\\\\/]");
Что разделит меня на текст в соответствии с указанными символами. Одним из символов является «-», потому что в моем тексте есть такие странные вещи: «-------------- words --- words2 --words3 - words4». Который будет соответствовать моим потребностям, потому что он не будет делиться следующим образом (в случае, если я не добавлю «-»): «--- words3 --- words4 (который будет считаться словом, если я не добавлю« - »). *
Но есть хитрость. Я хочу разрешить такие слова: "aaa-bbb", что подтверждается этим шаблоном:
Pattern pattern = Pattern.compile("(?<![A-Za-z-])[A-Za-z]+-[A-Za-z]+(?![A-Za-z-])");
разрешить: aaa-bb, aaa-bbbbbbb
не разрешать: ааа - bb, аа - bbb-cc
Итак, мой вопрос, возможно ли разделить мой текст, применяя разделение выше, но также учитывая, что этот шаблон является разделителем слов (для таких слов, как aaa-bbb)?
Спасибо заранее,
Ричард