Question

У меня есть набор документов Word, которые я хочу опубликовать с помощью написанного мной инструмента PHP. Я копирую и вставляю документы Word в текстовое поле, а затем сохраняю их в MySQL с помощью программы PHP. У меня возникает проблема со всеми нестандартными символами, которые есть в документах Word, такими как фигурные кавычки и эллипсы («...»). В настоящий момент я вручную выполняю поиск и замену таких вещей (а также иностранных символов, таких как e-sharp) на обычные текстовые или HTML-объекты (& eacute; и т. Д.). Есть ли в PHP функция, которую я могу вызвать, которая примет вывод документа Word и преобразование всего, что должно быть сущностями, в сущности, а другие символы, которые не отображаются должным образом в Firefox, в отображаемые символы.

Спасибо!

eyelidlessness · Answer 1 · 13 октября 2008

Это хорошо послужило мне в прошлом:

$str = mb_convert_encoding($str, 'HTML-ENTITIES', 'UTF-8')

Richard Turner · Answer 2 · 13 октября 2008

Лучшим решением было бы убедиться, что ваша база данных настроена на поддержку символов UTF-8. Дополнительные символы, доступные в расширенном наборе, должны охватывать все «нестандартные» символы, о которых вы говорите.

В противном случае, если вам действительно необходимо преобразовать эти символы в объекты HTML, используйте htmlentities () .

Bheema · Answer 3 · 18 мая 2010

Я думаю, что во всех этих ответах упущен один важный момент. Сама Windows использует Windows-латинскую разновидность latin1, поэтому, если вы вставляете некоторые специальные символы (например, асимметричные кавычки) в форму на компьютере с Windows, и она отправляется в поле Unix (или что-нибудь, кроме muckrosoft) (будь то в базу данных или что-то в этом роде) некоторые символы не сопоставляются ни с чем, что понимает система unix, отсюда и запутанные и искаженные символы. Это означает, что даже если у вас есть база данных UTF-8 и вы используете htmlentities, некоторые неприятности все равно пройдут, потому что это символы, которые ОС не распознает - они даже не являются частью UTF-8 - изобретения только для Microsoft. Мне бы очень хотелось узнать о хитром решении: я делаю вручную черный список кодов символов только для Microsoft, с которыми я столкнулся, со списком символов UTF-8 (также вручную), для всех из них создаю str_replace и Тогда вы можете делать с ними все, что захотите - iconv, htmlentities, сохранять прямо в базе данных utf8, это уже не имеет значения.

Я понимаю, что все это немного шатко - зацените http://www.cs.tut.fi/~jkorpela/www/windows-chars.html для превосходного объяснения, которое я изуродовал в краткой форме выше. - Если у кого-то есть лучшее решение (конечно, есть такое!) Того, как PHPify, что объясняет эта статья ... Я хотел бы услышать это!

tylerl · Answer 4 · 03 июля 2011

Вот решение, которое я приготовил для проблемы с непереносимым набором символов Windows. Это заменяет оскорбительные символы почти-Latin-1 их эквивалентными объектами HTML.

$translation=array(
    // reference from http://www.cs.tut.fi/~jkorpela/www/windows-chars.html
    "\x82" => "&#8218;",
    "\x83" => "&#402;",
    "\x84" => "&#8222;",
    "\x85" => "&#8230;",
    "\x86" => "&#8224;",
    "\x87" => "&#8225;",
    "\x88" => "&#710;",
    "\x89" => "&#8240;",
    "\x8a" => "&#352;",
    "\x8b" => "&#8249;",
    "\x8c" => "&#338;",
    "\x91" => "&#8216;",
    "\x92" => "&#8217;",
    "\x93" => "&#8220;",
    "\x94" => "&#8221;",
    "\x95" => "&#8226;",
    "\x96" => "&#8211;",
    "\x97" => "&#8212;",
    "\x98" => "&#732;",
    "\x99" => "&#8482;",
    "\x9a" => "&#353;",
    "\x9b" => "&#8250;",
    "\x9c" => "&#339;",
    "\x9f" => "&#376;",
);    
return str_replace(array_keys($translation),array_values($translation),$input);

Это работает для меня ^ТМ

acrosman · Answer 5 · 13 октября 2008

htmlspecialchars () проделает долгий путь, но следите за тем, чтобы документы Word были грязными.

Преобразование документа Word в пригодный для использования HTML в PHP

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 5 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Преобразование документа Word в пригодный для использования HTML в PHP

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 5 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов