Как автоматически определить iso-8859-1 в сравнении с кодировкой utf-8 в php? - PullRequest
2 голосов
/ 10 марта 2011

У меня есть устаревшая таблица базы данных со смешанной кодировкой. Некоторые строки - utf-8, некоторые - iso-8859-1.

Есть ли какая-то эвристика, которую я могу применить к содержимому строки, чтобы угадать, какая кодировка лучше всего отражает содержимое.

Ответы [ 3 ]

1 голос
/ 10 марта 2011

Вы можете взглянуть на Определить кодировку и сделать все UTF-8 , которые решают ту же проблему

1 голос
/ 10 марта 2011

Сравнить

iconv("UTF-8", "ISO-8859-1//IGNORE", $text)

и

iconv("UTF-8", "ISO-8859-1", $text)

Если они не равны - считайте это utf-8.

1 голос
/ 10 марта 2011

Конвертировать из UTF-8.Если это не помогло, тогда это не UTF-8, поэтому вам, вероятно, следует вместо этого конвертировать из Latin-1.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...