Parsoid - разбор wikitext локально - PullRequest
0 голосов
/ 02 мая 2018

Это вообще возможно?

Я не уверен, правильно ли я понимаю проект. Я пытаюсь проанализировать большое количество вики-текста в HTML с помощью проекта Parsoid-JSAPI.

Парсинг работает нормально, но он все еще вызывает API Викимедиа. Я запустил сервер локально, но библиотека все еще использует общедоступный интернет-API вместо моего локального сервера. Если я пытаюсь указать домен, позвонив Parsoid.parse("wikitext", {domain: 'localhost'}), он говорит No API URI available for prefix: null; domain: localhost

Мой config.yaml:

mwApis:
    uri: 'http://localhost/w/api.php'
    domain: 'localhost'

1 Ответ

0 голосов
/ 08 мая 2018

Разбор Викитекст возможен, конечно; это то, что делает Парсоид. Анализ содержимого Википедии невозможен (без вызовов API), поскольку 1) необходимо разрешить шаблоны и другой включенный контент и 2) часть разметки управляется расширениями, и Parsoid откладывает их.

Вы можете настроить локальный экземпляр MediaWiki, настроить все необходимые расширения и импортировать все соответствующие страницы (есть опция «включить шаблоны» при экспорте контента), но это требует больших усилий.

...