Как мне прочитать файл .tar.xz? - PullRequest
       52

Как мне прочитать файл .tar.xz?

1 голос
/ 07 февраля 2020

Я скачал набор данных Gwern Branwen здесь: https://www.gwern.net/DNM-archives

Я пытаюсь прочитать набор данных в R, и у меня много проблем. Я попытался открыть один из файлов в наборе данных с именем «1776.tar.xz», и я думаю, что «разархивировал» его с помощью untar (), но я ничего не получаю.

untar("C:/User/user/Downloads/dnmarchives/1776.tar.xz",
  files = NULL,
  list = FALSE, exdir = ".",
  compressed = "xz", extras = NULL, verbose = FALSE, restore_times = TRUE,
  tar = Sys.getenv("TAR"))

Изменить: Спасибо за все комментарии до сих пор! Код находится в базе R. У меня есть несколько наборов данных, которые я скачал с веб-сайта Gwern. Я просто пытаюсь открыть один, чтобы исследовать.

Ответы [ 3 ]

4 голосов
/ 07 февраля 2020

База R включает функцию untar. На моем Ubuntu 19.10 с R 3.6.2, установка по умолчанию, было достаточно следующего:

fls <- list.files(pattern = "\\.xz")
untar(fls[1], verbose = TRUE)

Примечание.
В вопросе "набор данных" является единственным, но были несколько наборов данных (множественное число) на этом сайте. Для загрузки файлов я использовал

args <- "--verbose rsync://78.46.86.149:873/dnmarchives/grams.tar.xz rsync://78.46.86.149:873/dnmarchives/grams-20150714-20160417.tar.xz ./"
cmd <- "rsync"

od <- getwd()
setwd('~/tmp')

system2(cmd, args)
0 голосов
/ 01 марта 2020

Спасибо всем! Не уверен, что с r немного не так, но я переустановил В итоге я разархивировал вручную и загрузил файлы.

0 голосов
/ 07 февраля 2020
  1. В Debian или Ubuntu сначала установите пакет xz-utils
$ sudo apt-get install xz-utils
Извлеките .tar.xz так же, как и любой файл tar .__.
$ tar -xf file.tar.xz

Готово.

...