Question

У меня есть устаревшая таблица базы данных со смешанной кодировкой. Некоторые строки - utf-8, некоторые - iso-8859-1.

Есть ли какая-то эвристика, которую я могу применить к содержимому строки, чтобы угадать, какая кодировка лучше всего отражает содержимое.

Jon Skarpeteig · Answer 1 · 10 марта 2011

Вы можете взглянуть на Определить кодировку и сделать все UTF-8 , которые решают ту же проблему

Vladislav Rastrusny · Answer 2 · 10 марта 2011

Сравнить

iconv("UTF-8", "ISO-8859-1//IGNORE", $text)

и

iconv("UTF-8", "ISO-8859-1", $text)

Если они не равны - считайте это utf-8.

Ignacio Vazquez-Abrams · Answer 3 · 10 марта 2011

Конвертировать из UTF-8.Если это не помогло, тогда это не UTF-8, поэтому вам, вероятно, следует вместо этого конвертировать из Latin-1.

Как автоматически определить iso-8859-1 в сравнении с кодировкой utf-8 в php?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.