Как я могу преобразовать большой файл Multimarkdown в HTML? - PullRequest
2 голосов
/ 30 октября 2010

У меня большой (~ 4 ГБ) текстовый файл, написанный в формате Multimarkdown, и я хотел бы преобразовать его в HTML.

Я пробовал:

use strict;
use warnings;

use File::Map qw (map_file);
use Text::MultiMarkdown qw (markdown);

my $filename = shift // die;
map_file (my $text, $filename);
print markdown($text);

, но он все еще задыхаетсяпамять.

Ответы [ 2 ]

1 голос
/ 01 ноября 2010

Я заметил, что Discount удается выдержать около 100 МБ. Pandoc , похоже, переносит около 20 МБ. Ни один из них не управляет точно расширениями уценки MMD, но у обоих есть свои эквиваленты для большинства из них.

Разве это не главная проблема с этим планом: что вы собираетесь использовать, чтобы прочитать html? Chrome удалось открыть файлы размером 100 МБ, но, к примеру, потребовалось много памяти. выполнить поиск или навести курсор вниз. Может быть, вам нужен план, подобный плану Синан, но который выдает отдельные html-файлы для каждого чанка и заканчивается гиперссылкой на следующий файл ....

1 голос
/ 30 октября 2010

Вам необходимо обработать файл в чанках, убедившись, что чанки заканчиваются игнорируемым пробелом (чтобы не разбивать списки и таблицы и т. Д.).

Предоставьте больше информации относительно структуры и содержимого файла, чтобы помочь нам дать вам другие полезные указатели.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...