Javascript Regex Unicode Помощь - PullRequest
       5

Javascript Regex Unicode Помощь

1 голос
/ 01 февраля 2010

в JavaScript, я использую Regex для split(/\W+/) в слова.

когда я делю это, он возвращает неправильное значение

var s3 = "bardzo dziękuję";
s3 = s3.split(/\W+/);


[0]: "bardzo"
[1]: "dzi"
[2]: "kuj"

Как решить эту проблему? пожалуйста, совет

Ответы [ 3 ]

1 голос
/ 01 февраля 2010

Регулярное выражение не расщепляется, потому что оно рассматривает ваши акцентированные символы как несловарные символы.

Используйте специальный символ пробела: -

s3 = s3.split(/\s+/);
1 голос
/ 23 марта 2013

Вы можете использовать CharFunk https://raw.github.com/joelarson4/CharFunk, который полностью обрабатывает Unicode.

var s3 = "bardzo dziękuję";

function notLetterOrDigit(ch) {
    return !CharFunk.isLetterOrDigit(ch);
}

CharFunk.splitOnMatches(s3, notLetterOrDigit);
1 голос
/ 01 февраля 2010

В таком случае, почему бы просто не разбить пробел?

s3.split(/\s+/);

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...