Читать в .xrdml данные в сложном массиве - PullRequest
0 голосов
/ 02 сентября 2018

Я пытаюсь прочитать несколько файлов типа ".xrdml" и объединить их в один фрейм данных с интуитивно понятной меткой. Проблема в том, что этот тип файла имеет большие метаданные.

Я пробовал следующее

Требуется пакет

library(rxylib)

Вещи, которые я пытался

temp = list.files(pattern="*.xrdml")
xyz<-do.call(rbind,sapply(temp, read_xyData,verbose = TRUE,metaData = FALSE))

я получил список, я могу вызвать каждого участника списка, используя, например, xyz[[2]]

          2Theta    V2
   [1,]  4.006565  3496
   [2,]  4.019695  3417
   [3,]  4.032826  3520
   [4,]  4.045956  3516
   [5,]  4.059086  3480
   [6,]  4.072217  3343
   [7,]  4.085347  3466
   [8,]  4.098477  3552
   [9,]  4.111607  3425
  [10,]  4.124738  3384

если я попытаюсь сгладить список с помощью функции unlist, то результат станет грязным

Я хотел бы прочитать все файлы и объединить их по столбцам, каждый файл имеет первый общий столбец, т.е. 2Theta. я также хотел бы использовать уникальную часть каждого заголовка файла для обозначения V2

мои файлы имеют заголовки типа "BBHD-FASS_4-70_step01_40s_ LM 11_5 .xrdml". то, что я надеюсь сделать в конце, - это иметь кадр данных, подобный приведенному ниже образцу

2Theta   LM 6-26  LM 6-27  LM 6-28 LM 4-10 LM 4-11 LM 4-12
4.006565    3576    3535    3677    3576    3535    3677
4.019695    3526    3552    3662    3526    3552    3662
4.032826    3584    3581    3657    3584    3581    3657
4.045956    3489    3535    3539    3489    3535    3539
4.059086    3496    3507    3525    3496    3507    3525
4.072217    3335    3466    3628    3335    3466    3628
4.085347    3353    3456    3444    3353    3456    3444
4.098477    3430    3479    3588    3430    3479    3588
4.111607    3334    3547    3535    3334    3547    3535
4.124738    3424    3342    3439    3424    3342    3439
4.137868    3349    3384    3459    3349    3384    3459
4.150998    3318    3395    3413    3318    3395    3413
4.164129    3208    3490    3457    3208    3490    3457
4.177259    3357    3295    3519    3357    3295    3519
4.190389    3254    3372    3450    3254    3372    3450

Вот примеры моих файлов Примеры файлов

К сожалению, я потратил так много времени, уже пробуя несколько вещей, которые не сработали.

Я буду очень благодарен за любую помощь или совет, который я могу получить, как решить эту проблему.

1 Ответ

0 голосов
/ 19 ноября 2018

Чтобы получить данные, вам нужно найти правильную позицию в списке данных, который возвращается read_xyData. Вы можете сделать это, посмотрев на str(lst) ниже. Для доступа к данным используйте ...$dataset[[1]]$data_block. (в пакете могут быть функции экстрактора, но я не проверял)

# download data : link dead
#download.file("https://ucc93bf0aa50821e11b95c9530f5.dl.dropboxusercontent.com/zip_by_token_key?_download_id=9101556320431172280658295109635067362614982268430911643523348&_notify_domain=www.dropbox.com&dl=1&key=AV5mxk0trnetzASlH9_xJijTiGE55mUz0qa-x7JveZ7-Rdp3Z8i7GmwwQoWj8tUO14RKj51huhb5CuBdoxAC3WLuHvOMr7_bul691AmGpmwZgWWy0STezjFRnq0CVUR-iHNnZUHk9-t-i72nYODDpjXvo0PBhWTXwJuNWCSL4bnAauZREQtZwzNlspMF8PwZ37E9enf1WUUakLJwE43GbV2lAkuOTDghfcMmwokulIMEGA", destfile=temp<-tempfile())
unzip(temp, exdir=xdir<-tempdir())  

nms <- list.files(xdir, pattern="xrdml", full.names=TRUE)
# grab the names to names columns later
cnms <- gsub(".*(LM \\w+).*$", "\\1", basename(nms))


library(rxylib)

# loop through files to read in
lst <- lapply(nms, read_xyData, verbose = TRUE, metaData = FALSE)

# grab the data
dats <- lapply(lst, function(x) x$dataset[[1]]$data_block)

# rename second column
dats <- lapply(seq_along(dats), function(x) {
                          colnames(dats[[x]])[2] <- cnms[x] ; dats[[x]]})

# merge
alldat <- Reduce(function(...) merge(..., by="2Theta"), dats)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...