Это не то, что вы можете сделать безошибочно. Одной из возможностей может быть проверка каждого символа в файле, чтобы убедиться, что он не содержит символов в диапазонах 0x00 - 0x1f
или 0x7f -0x9f
, но, как я уже сказал, это может быть верно для любого количества файлов, включая, по крайней мере, еще один вариант ISO8859.
Другая возможность состоит в том, чтобы найти конкретные слова в файле на всех поддерживаемых языках и посмотреть, сможете ли вы их найти.
Так, например, найдите эквивалент английского «и», «но», «к», «of» и т. Д. На всех поддерживаемых языках 8859-1 и посмотрите, имеют ли они большое количество вхождения в файле.
Я не говорю о буквальном переводе, таком как:
English French
------- ------
of de, du
and et
the le, la, les
хотя это возможно. Я говорю об общих словах на целевом языке (насколько я знаю, в исландском языке нет слова "и" - вам, вероятно, придется использовать их слово для "рыбы" [извините, это немного стереотипно, я не имею в виду любое оскорбление, просто иллюстрирующее точку зрения)).