это отображается как '
Это символ U + 2019 ПРАВИЛЬНАЯ ОДНОКВАЖНАЯ МАРКА.* передано вам в кодировке UTF-8, которая выражается в байтах:
’ s
E2 80 99 73
Эта последовательность байтов была неверно интерпретирована так, как если бы она была закодирована в кодовой странице Windows 932 (на японском языке;более или менее Shift-JIS):
E2 80 99 73
窶 冱
Таким образом, в этом конкретном случае вы можете восстановить строку ’s
, сначала кодируя символы в байты cp932, а затем декодируя эти байты обратно в символы, используяUTF-8.
Однако, это не решит вашу реальную проблему, которая заключается в том, что строки были прочитаны неправильно в первую очередь.В этом случае вы получили 窶冱
, потому что последовательность байтов UTF-8, полученная в результате кодирования ’s
, также оказалась действительной последовательностью байтов Shift-JIS.Но это не относится ко всем возможным последовательностям байтов UTF-8, которые вы можете получить.Многие другие символы будут безвозвратно искажены.
Вам нужно найти, где байты считываются в систему и декодируются как Shift-JIS, и исправить это, чтобы вместо этого использовать UTF-8.