Я сразу хочу извиниться, так как engli sh не является моим родным языком, поэтому извините, если на самом деле «символизированная строка» или что-то подобное не имеет смысла.
Моя ситуация: я читаю Google, который поддерживается CSV-файл устройства (https://support.google.com/googleplay/answer/1727131?hl=en) с nodejs примерно так:
readFileSync(PATH, 'utf16le').split('\n');
Одна из строк выглядит как Y6 \xe2\x85\xa1 Compact
\xe2\x85\xa1
строковый литерал UTF-8, который фактически обозначает Ⅱ
(римская цифра 2) (по крайней мере, в соответствии с этим: https://www.utf8-chartable.de/unicode-utf8-table.pl?start=8448&number=128&utf8=string-literal&text=8545)
Когда я пытаюсь разобраться с этим строковым узлом, auto добавляет \\, делая его \\xe2\\x85\\xa1
, поскольку \ x не является допустимым символом и т. д. c.
Но есть ли какой-нибудь способ, которым я мог бы на самом деле получить римскую цифру?
Если нет, то есть ли какие-либо предложения по легкому удалению таких данных полностью (римская цифра более «крутая») чем «должен»)