Это не «символы юникода» - это артефакты испорченной кодировки символов. В этом случае наиболее вероятным объяснением является то, что вы интерпретируете utf-8
данные как windows-1252
. Это может произойти, если вы возьмете кодированную строку utf-8
и отобразите ее в оболочке на окнах. Или, если вы отображаете его на веб-странице, отправьте заголовок Content-Type
с charset=windows-1252
. Конечно, только образованные предположения могут быть разными способами.
Решением вашей проблемы является обработка данных как utf-8
.