Я видел какой-то действительно длинный код синтаксического анализа, но он не включает замену содержимого внутри открытого файла, например, с помощью file_get_contents()
. Я говорю о синтаксическом разборе .doc
в .html
формате. Они читают файл, а затем выводят его в формате HTML. Я пробовал это с использованием массивов и preg_replace
, но он не выглядит таким чистым, как другой код. Кто-нибудь знает основную концепцию разбора? Спасибо, скажите мне, если я не ясно.
Редактировать: допустим, я получил это из файла doc или rtf: \ b text \ b
Это должно быть преобразовано в <strong>text</strong>
. Другие делают это без preg_replace
или str_replace
и прочего, почти как если бы они как-то строили новую страницу.