Я использую Google переводчик для перевода текста.
Иногда переводчик Google добавляет непечатаемые символы в переведенный текст.
Например, перейти на эту страницу:
https://www.google.com/search?client=ubuntu&channel=fs&q=traduttore&ie=utf-8&oe=utf-8
Выберите с итальянского на английский и переведите leone marino
.
Результат будет:
sea lion
^ here there are other two non-printable chars, exactly before the "l" char
Вы можете проверить его, поместив текст в любое место, где вы можете его изменить (например, в текстовом редакторе или в текстовом поле на любой веб-странице, или даже в URL браузера), и, перемещаясь со стрелками на клавиатуре, вы заметите, что курсор остановится в два раза ближе к символу пробела.
Оставляя в стороне причину, по которой эти символы вставляются, как я могу удалить все эти непечатаемые символы, используя Regex с PHP и / или используя возвышенный текст?
А как посмотреть версию этих символов в юникоде?