Я начал отладку своего канала RSS, потому что в нем есть несколько странных символов (то есть глиф отсутствующего символа). Я начал с двух отличных ресурсов для начинающих:
Причина, по которой я считаю, что у нашего RSS-канала возникают проблемы, заключается в том, что пользователи копируют и вставляют документы MS Word в текстовую область на сайте, а наши страницы PHP используют кодировку "iso-8859-1", которая несовместима со специальной "Windows". -1252 "кодировки для таких вещей, как маркеры и умные кавычки, используемые в MS Word.
Так что я надеюсь исправить проблему, все, что мне нужно сделать, это начать использовать «utf-8» на страницах, которые принимают / дают пользовательский ввод ??. То есть установите следующее в разделе HEAD:
<meta http-equiv="Content-Type" content="text/html;charset=utf-8" />
Однако настоящая причина, по которой я поднимаю этот вопрос, заключается в том, что мои поля БД, в которых хранятся мои пользовательские данные, находятся в "latin1_swedish_ci
", и я хочу знать, НУЖНО ЛИ Я преобразовать их в "utf8_general_ci
"? MySQL действительно не заботится о кодировке, не так ли? Он просто видит кучу байтов, и если я добавлю Unicode в поле, сопоставленное с латиницей, оно все равно вернется как Unicode, верно? Изменение поля будет утомительным, потому что поле является частью индекса FULLTEXT, где другие поля также нуждаются в изменении параметров сортировки, что означает удаление индекса и его перестроение (что немалая задача, когда задействовано большое количество TEXT).