All
Я создаю небольшое веб-приложение, которое будет принимать пользовательский контент. Это содержимое будет загружено с помощью enctype="multipart/form-data"
формы и кнопки просмотра .
Как я понимаю mb_detect_encoding()
, он не может различить наборы символов, которые являются подмножествами друг друга, если строка не содержит символов, которые не находятся в перекрытии. Это имеет смысл.
Мой вопрос: это имеет значение? Если я использую mb_detect_encoding()
, чтобы получить лучшее предположение PHP, а затем использую это лучшее предположение для кодирования в UTF-8, используя iconv()
, я столкнусь с проблемой, и если да, то почему?
Другими словами, если mb_detect_encoding()
придет с неправильной кодировкой для маленькой строки, которая полностью находится в перекрытии двух кодировок, получу ли я другой результат, когда я тогда выполню iconv()
, чем если бы я имел использовали правильную кодировку ввода в функции?
РЕДАКТИРОВАТЬ: я переписал вопрос, чтобы специально адресовать текстовые файлы, загруженные с помощью кнопок обзора.