Я работаю над сканером уязвимостей для веб-приложений и столкнулся с проблемой, которую не могу решить. Веб-приложения обычно используют кодировку UTF8, которая использует 1-4 байта на символ. Например, 4-байтовый символ в кодировке UTF8 должен начинаться с байта «11110xxx», за которым следуют еще 3 байта, которые выглядят как «10xxxxxx».
Я читал больше о UTF8 и обнаружил, что он также может поддерживать 5 и 6 байтов на символ. Если символ начинается с «111110xx», то это 5-байтовый символ, а если он начинается с «1111110x», то это 6-байтовый символ.
Я хочу добавить такие символы в веб-приложения (через мой сканер) и посмотреть, не сломаются ли они. Я пытался использовать библиотеку utf8.js (найдена в npm) для создания таких символов, но оказывается, что эта библиотека поддерживает UTF8 только до 4 байтов на символ.
Как программно создать символ, который использует 5 или 6 байтов с помощью JavaScript?