Ява Строка Сплит + шаблоны - PullRequest
1 голос
/ 01 октября 2011

Я использую этот метод для разделения текста:

String[] parts = sentence.split("[,\\s\\-:\\?\\!\\«\\»\\'\\´\\`\\\"\\.\\\\\\/]");

Что разделит меня на текст в соответствии с указанными символами. Одним из символов является «-», потому что в моем тексте есть такие странные вещи: «-------------- words --- words2 --words3 - words4». Который будет соответствовать моим потребностям, потому что он не будет делиться следующим образом (в случае, если я не добавлю «-»): «--- words3 --- words4 (который будет считаться словом, если я не добавлю« - »). *

Но есть хитрость. Я хочу разрешить такие слова: "aaa-bbb", что подтверждается этим шаблоном:

Pattern pattern = Pattern.compile("(?<![A-Za-z-])[A-Za-z]+-[A-Za-z]+(?![A-Za-z-])");

разрешить: aaa-bb, aaa-bbbbbbb не разрешать: ааа - bb, аа - bbb-cc

Итак, мой вопрос, возможно ли разделить мой текст, применяя разделение выше, но также учитывая, что этот шаблон является разделителем слов (для таких слов, как aaa-bbb)?

Спасибо заранее, Ричард

1 Ответ

0 голосов
/ 01 октября 2011

Из того, что я понял, вы узнаете следующее:

String[] parts = sentence.split(/[\-]{2,}/);
...