Разница в длине строки бенгальского Unicode - PullRequest
2 голосов
/ 05 мая 2019

Я обнаружил следующие две разные длины одной и той же строки, видимые на глаз.

"ব্রাহ্মণবাড়িয়া".length
16
"ব্রাহ্মণবাড়িয়া".length
14

В чем причина этой разницы?

enter image description here

1 Ответ

3 голосов
/ 05 мая 2019

.length в JS возвращает количество кодовых точек в строке.Проверьте сами:

var a = "ব্রাহ্মণবাড়িয়া";
var b = "ব্রাহ্মণবাড়িয়া";

// this returns 16 elements:
for (var i = 0; i < a.length; ++i) {console.log(a[i]);}
// 14 elements:
for (var i = 0; i < b.length; ++i) {console.log(b[i]);}

Разница вызвана тем, что символы могут быть представлены по-разному: ড + ় vs ড় и য + * vs য়.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...