Я использовал скрипт bzip-seek2 Джеймса Тейлора для случайного доступа к содержимому .bz2
файлов. Википедия сбрасывает все статьи в один файл XML
, сжатый с использованием bzip2
. Я пытался создать карту памяти для всех статей Википедии, сжатых в формате bzip
, но я получал «ошибку данных».
Для этого нет документации. Есть ли способ создать карту памяти для этого файла?