Есть ли более быстрая альтернатива mwdumper для импорта xmls? - PullRequest
1 голос
/ 02 сентября 2011

Я ищу более быструю альтернативу использованию mwdumper для импорта дампов mediawiki xml.Я использовал wget для загрузки xmls одна за другой для больших статей, и мне нужно импортировать несколько сотен.Импорт по одному занимает слишком много времени

команда java -jar mwdumper.jar --format = sql: 1.5 page1.xml |mysql -u username -d имя_базы данных, похоже, не работает в командной строке Windows.

1 Ответ

0 голосов
/ 04 января 2014

Я сравнил несколько доступных вариантов.maintenance/importDump.php был для меня победителем:

  • Это часть самого MediaWiki, так что больше шансов остаться поддерживаемым и меньше шансов на аномалии (что вы непременно получите, если начнете возиться с SQL-запросами самостоятельно).
  • Это как минимум в два раза быстрее, чем какой-то код, который я основал на коде из maintenance/edit.php.
  • . Он может работать на существующей установке MediaWiki.
  • Работаетхорошо с GNU Parallel .
  • Приятный отзыв в виде 20.23 revs/sec
...