Я разрабатываю API, который принимает URL-адрес в качестве ввода и читает содержимое по этому URL-адресу. Если URL является протоколом «file:», что может быть лучше по умолчанию для кодировки символов?
- собственная кодировка системы
- UTF-8
API позволяет установить это явно. Кроме того, есть несколько эвристик, которые мы можем использовать для определения кодировки символов, например, спецификация, если таковая имеется, но когда все они терпят неудачу, что должно быть по умолчанию?
Насколько я могу судить, стандарты молчат по этому вопросу. При прочих равных, я хочу, чтобы правильные вещи происходили чаще всего для тех, кто даже не знает, что существует такая вещь, как кодировка символов.