Черновик HTML5 содержит таблицу кодировок по умолчанию для языков , отражающую то, что считается распространенным. Однако обратите внимание, что предполагается, что он основан на пользовательской локали, т.е. на языке браузера или операционной системы, а не на языке документа - очевидно, потому что последний обычно неизвестно, по крайней мере, до того, как вы действительно прочитаете документ, исходя из некоторых предположений о кодировке.
Я думаю, вы могли бы на практике скопировать список кодировок в популярном веб-браузере. Если он хорошо работает там, он, вероятно, работает достаточно хорошо в вашем приложении. Браузеры делают некоторые умные вещи со списком и его порядком, но на практике, я думаю, было бы достаточно иметь короткий список, такой как utf-8, utf-16, windows-1252 и, возможно, несколько других, за которыми следует опция получить полный список. Обратите внимание, что хотя utf-16 практически не используется и бесполезен для веб-страниц, он является обычным для обычных текстовых файлов. Важно правильно назвать кодировки, желательно с общим английским (или другим языком) именем вместе с именем «charset» IANA в скобках - так же, как это делают браузеры.