Лучший формат разметки для перспективных больших текстовых блоков? - PullRequest
2 голосов
/ 01 ноября 2011

У меня есть несколько записей (= <100), которые содержат значительные куски текста, которые требуют разметки (семантически: списки, заголовки, таблицы, ссылки, цитаты и т. Д.) Перед сохранением в файле многократного использованияформат. </p>

При сохранении он, вероятно, останется более или менее неизменным в течение как можно большего числа лет в будущем.

Содержит некоторые не-ascii, поэтому требуется UTF-8.Я начал использовать HTML, затем подумал о Markdown ... но хотел бы знать, что люди считают наиболее перспективным форматом разметки для долгосрочного хранения ?Первоначально контент предназначен для (в основном статического) веб-сайта, но может использоваться как контент для других выходных данных.

Наконец, мнения о выборе хранилища для долгосрочного использования - база данных,отдельные документы ...?Изменения в записях будут редкими и редактироваться только 1-3 людьми, а доступ для чтения должен со временем увеличиваться.


Обновление:

Я наконец-то выбрал общие функции (например,для таблиц) между MultiMarkdown , PHP Markdown Extra и Kramdown в качестве текстового формата (Markdown опускает слишком много HTML-тегов), и я конвертирую полученные файлы в htmlс Крамдауном.Сейчас я пробую редакторы iOS Markdown , которые могут обрабатывать расширенную Markdown и синхронизироваться через Dropbox с моим рабочим столом / ноутбуком.

1 Ответ

1 голос
/ 11 ноября 2011

Любое хранилище, не предназначенное для долгосрочного архивирования, сломается .

Вопрос не столько в базе данных, сколько в файловой системе, а в том, как обеспечить отсутствие (молчаливого) повреждения данных и как перенести данные.Я не могу дать вам однозначных ответов, потому что это зависит от множества факторов (в том числе затрат), но вот несколько ресурсов:

У меня нет реального ответа на вопрос о формате, но я думаю, что HTML +UTF-8 должен быть читаемым даже через десятилетия, но задокументируйте его.

...