Как определить, в каком формате кодируется какой-либо текст, ASCII, Unicode или UTF-8?
Не существует гарантированного способа обнаружения кодировки произвольного набора байтов.
Сорвал с моего ответа здесь .