У меня есть устаревшая таблица базы данных со смешанной кодировкой. Некоторые строки - utf-8, некоторые - iso-8859-1.
Есть ли какая-то эвристика, которую я могу применить к содержимому строки, чтобы угадать, какая кодировка лучше всего отражает содержимое.
Вы можете взглянуть на Определить кодировку и сделать все UTF-8 , которые решают ту же проблему
Сравнить
iconv("UTF-8", "ISO-8859-1//IGNORE", $text)
и
iconv("UTF-8", "ISO-8859-1", $text)
Если они не равны - считайте это utf-8.
Конвертировать из UTF-8.Если это не помогло, тогда это не UTF-8, поэтому вам, вероятно, следует вместо этого конвертировать из Latin-1.