Как я могу извлечь отдельные слова и ссылки из текста? - PullRequest
0 голосов
/ 08 февраля 2019

Я пытаюсь извлечь слова из текста.Мой текст выглядит так:

String text = "This is my text and it contains a url: http://www.google.com";
String[] words = text.split("\\W+");

Проблема здесь в том, что таким образом URL разбивается на такие слова, как http www google com, и он становится бесполезным для меня.

Вместо того, что яхотел бы иметь такой массив:

This
is
my
text
and
it
contains
a
url
http://www.google.com

Есть идеи / предложения?

Ответы [ 2 ]

0 голосов
/ 08 февраля 2019

Я бы пошел с

text.split("\\s+");

В регулярном выражении \s соответствует любым пробельным символам, против split(" "), который будет соответствовать только Unicode \u0020

0 голосов
/ 08 февраля 2019
String[] words = text.split(" ");

Вернется [Это, мой, текст, и, он, содержит, URL,: http://www.google.com]

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...