PHP, MSSQL2005 и кодовые страницы - PullRequest
1 голос
/ 04 декабря 2008

У меня есть скрипт php, который обращается к базе данных MSSQL2005, считывает некоторые данные из нее и отправляет результаты по почте.

В некоторых именах столбцов и в самих полях есть специальные символы.

Когда я получаю доступ к сценарию через свой браузер (веб-сервер iis), запрос выполняется правильно, а содержимое письма корректно (для моей аудитории) кодируется. Однако, когда я выполняю php из консоли, запрос не выполняется (из-за специальных символов в именах столбцов). Если я заменю специальные символы в запросе вызовами chr () и символьным кодом в латинице-1, запрос будет выполнен правильно, но результаты также будут закодированы в латинице-1 и, следовательно, не будут правильно отображаться в почте. Почему PHP / драйвер MSSQL /… использует разные кодировки в двух сценариях? Есть ли способ обойти это?

Если вам интересно, мне нужна консоль, потому что я хочу запланировать сценарий, используя SQLAgent (или TaskManager или что-то еще).

Ответы [ 3 ]

2 голосов
/ 13 декабря 2008

В зависимости от типа символов в вашей базе данных, это может быть ограничение консоли, я думаю. Если вы введете chcp в консоли, вы увидите, что такое активная кодовая страница, которая может выглядеть примерно так: CP437 , также известная как Extended ASCII. Если у вас есть символы вне этой кодовой страницы, как в UTF8, вы можете столкнуться с проблемами. Вы можете изменить текущую активную кодовую страницу, набрав chcp 65001, чтобы переключиться на UTF8.

Возможно, вы также захотите изменить шрифт Raster по умолчанию на Lucida Console в зависимости от требуемых символов, поскольку не все шрифты поддерживают расширенные символы (щелкните правой кнопкой мыши заголовок окна командной строки, свойства, шрифт).

Как уже говорилось, поддержка юникода в PHP не идеальна, но вы можете сделать это в PHP5 с помощью нескольких хорошо расположенных функций utf8_decode . Секрет кодирования символов заключается в том, чтобы хорошо понять, какая текущая кодировка всех инструментов, которые вы используете: база данных, соединение с базой данных, текущие байты в вашей переменной PHP, ваш вывод на экран консоли, тело вашей электронной почты кодирование, ваш почтовый клиент и так далее ...

Для всех, у кого есть специальные символы, в наши дни часто рекомендуется что-то вроде UTF8. Убедитесь, что все на пути установлено в UTF8 и конвертируйте только при необходимости.

1 голос
/ 13 декабря 2008

В PHP-строках следует помнить, что они представляют собой потоки байтов. Если вы хотите получить данные в правильном наборе символов (для всего, что вы делаете), вы должны сделать это явно через какую-то функцию или фильтр. Это все довольно низкоуровневое.

В зависимости от ваших настроек, вам может понадобиться знать внутренний набор символов строк в базе данных, но, по крайней мере, вам нужно знать, какой набор символов отправляет база данных в PHP (потому что, помните, в PHP это просто поток байтов).

Тогда вы должны знать целевой набор символов (и, возможно, указать его, что вам действительно нужно в любом случае). Например, предположим, что вы получаете utf-8 из базы данных, но хотите отправить латинский-1 (и, следовательно, base64 или q-printable, закодированный как 'Content-Transfer-Encoding'):

$send_string = base64_encode(utf8_decode($database_string));

Конечно, в этом случае вы должны знать, что все символы utf-8 существуют в наборе символов latin-1, и вам, вероятно, не нужен base64 (к сожалению, PHP не имеет хорошего q- пригодная для печати функция кодирования, хотя, как ни странно, она подходит для декодирования), и если вы не говорите о utf-8 <=> latin-1, вам нужно вместо этого вывести функции mbstring.

Что касается консоли, вам нужно знать, что получает PHP при вводе специальных символов с консоли, что, вероятно, зависит от настроек оболочки и / или PHP. Но помните, что PHP понимает строки только как байтовый байтовый байт, и вы должны быть в состоянии разобраться с этим.

1 голос
/ 04 декабря 2008

Плохая поддержка PHP не англоязычного мира хорошо известна. Я никогда не использовал базу данных с символами вне базовой области ASCII, но, очевидно, у вас уже есть обходной путь, и кажется, что вам просто нужно с этим жить.

Если вы хотите сделать еще один шаг, вы можете: 1. Напишите массив, который содержит все специальные символы и их эквиваленты CHR 2. foreach массив и str_replace по запросу

Но если запрос жестко запрограммирован, я думаю, у вас все в порядке. Также убедитесь, что вы используете последнюю версию PHP, по крайней мере, 4.4.x, всегда есть исправление, которое было исправлено, но я просмотрел примечания к выпуску 4.x.x и не вижу ничего, что относится к вашей проблеме.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...