в JavaScript, я использую Regex для split(/\W+/) в слова.
split(/\W+/)
когда я делю это, он возвращает неправильное значение
var s3 = "bardzo dziękuję"; s3 = s3.split(/\W+/); [0]: "bardzo" [1]: "dzi" [2]: "kuj"
Как решить эту проблему? пожалуйста, совет
Регулярное выражение не расщепляется, потому что оно рассматривает ваши акцентированные символы как несловарные символы.
Используйте специальный символ пробела: -
s3 = s3.split(/\s+/);
Вы можете использовать CharFunk https://raw.github.com/joelarson4/CharFunk, который полностью обрабатывает Unicode.
var s3 = "bardzo dziękuję"; function notLetterOrDigit(ch) { return !CharFunk.isLetterOrDigit(ch); } CharFunk.splitOnMatches(s3, notLetterOrDigit);
В таком случае, почему бы просто не разбить пробел?
s3.split(/\s+/);