кодировка php5: я не обнаруживаю турецких символов - PullRequest
0 голосов
/ 13 февраля 2010

У меня есть скрипт php, который определяет плотность ключевых слов по заданному URL.

Моя проблема в том, что он не обнаруживает турецкие символы и не удаляет их.

Я получаю содержимое URL методом file_get_contents. Этот метод отлично работает и получает все содержание турецких персонажей.

Вы можете увидеть мой код здесь или попробовать скрипт здесь .

1 Ответ

2 голосов
/ 13 февраля 2010

Вы, похоже, извлекаете и конвертируете данные file_get_contents как UTF-8 (вероятно, правильно), но ваша HTML-страница не задает кодировку для себя. Так что, вероятно, любая входящая форма данных находится в ISO-8859-1. Попробуйте указать utf-8 в качестве кодировки вашей страницы:

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />

И обязательная ссылка для чтения по основам кодирования: Абсолютный минимум Каждый разработчик программного обеспечения Абсолютно, положительно должен знать о Unicode и наборах символов (никаких оправданий!)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...