PHP - Могу ли я использовать mb_detect_encoding () + iconv () для преобразования строк в UTF-8? - PullRequest
2 голосов
/ 20 февраля 2012

All

Я создаю небольшое веб-приложение, которое будет принимать пользовательский контент. Это содержимое будет загружено с помощью enctype="multipart/form-data" формы и кнопки просмотра .

Как я понимаю mb_detect_encoding(), он не может различить наборы символов, которые являются подмножествами друг друга, если строка не содержит символов, которые не находятся в перекрытии. Это имеет смысл.

Мой вопрос: это имеет значение? Если я использую mb_detect_encoding(), чтобы получить лучшее предположение PHP, а затем использую это лучшее предположение для кодирования в UTF-8, используя iconv(), я столкнусь с проблемой, и если да, то почему?

Другими словами, если mb_detect_encoding() придет с неправильной кодировкой для маленькой строки, которая полностью находится в перекрытии двух кодировок, получу ли я другой результат, когда я тогда выполню iconv(), чем если бы я имел использовали правильную кодировку ввода в функции?

РЕДАКТИРОВАТЬ: я переписал вопрос, чтобы специально адресовать текстовые файлы, загруженные с помощью кнопок обзора.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...