Поиск строки в неизвестном html-кодировке - PullRequest
0 голосов
/ 08 июля 2010

Я использую strpos для поиска строки в теле веб-страницы. 50% не удается, хотя строка поиска присутствует. Я попытался указать строку поиска и искомый контент, результаты одни и те же. Вероятно, проблема возникает при работе с разными кодировками ...

Предполагая, что: - кодировка строки поиска неизвестна - искомый контент кодировки неизвестен - кодировка может быть любой ISOxx, UTF-8, Shift-JIS

Есть ли пуленепробиваемая функция для поиска подстроки?

Ответы [ 2 ]

1 голос
/ 08 июля 2010

Вы можете попробовать использовать mb_detect_encoding , чтобы сначала обнаружить кодировку, а затем преобразовать в кодировку, которую вы хотите использовать (используя iconv или mb_convert_encoding), и найти шаблон в этой кодировке.

0 голосов
/ 08 июля 2010

yup сначала преобразуйте html в utf8 / latin1, возьмите кодировку содержимого из заголовка Content-Type или из метатега, преобразуйте в utf8 / latin1 с помощью iconv, затем перестаньте беспокоиться об этом

...