Question

У меня есть сайт MediaWiki, на котором есть около 1000 дополнительных файлов в веб-каталогах, которые автоматически индексируются. Я бы хотел, чтобы эти страницы появлялись в индексе MediaWiki. Я предложил два подхода:

Написать плагин mediawiki, который создает страницу для каждого каталога, с маркированным списком для каждого элемента и ссылкой для загрузки объекта.
Напишите программу на python, которая использует mediaWiki API для создания страницы mediawiki для каждого элемента с полными метаданными. Затем я могу извлечь текст и поместить извлеченный текст на страницу, а также предварительно отформатированный текст MediaWiki.

Однако некоторые из этих документов довольно длинные, и поэтому я думаю, что другой подход будетизвлечь текст из PDF-файлов и поместить его в индекс MediaWiki. Для многостраничных PDF-файлов может даже иметь смысл загружать (автоматически?) Миниатюру первой страницы PDF или даже все страницы.

Так что же является подходящим способом ссылки на файлы PDF с полнымтекст на сайте MediaWiki?

Tgr · Answer 1 · 14 октября 2019

Используйте PdfHandler , чтобы предоставить метаданные PDF-файла для поиска и загрузить эти документы в виде файлов (например, Pywikibot или importImages.php ).

Как добавить ссылку на PDF-файлы с полным текстом на сайте MediaWiki

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как добавить ссылку на PDF-файлы с полным текстом на сайте MediaWiki

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы