Из опубликованного кода TCGA, как исправить ошибку: я не смог найти все файлы из запроса. Пожалуйста, проверьте параметр каталога справа - PullRequest
0 голосов
/ 13 ноября 2018

Я пытаюсь повторить процесс, опубликованный здесь: https://dockflow.org/workflow/tcga//

Опубликованный код прекрасно работает до раздела, говорящего: клинические данные могут быть получены с использованием TCGAbiolinks двумя способами.Первый метод загрузки проиндексированных клинических данных GDC работает, как и ожидалось:

lgg_clin <- GDCquery_clinic(project = "TCGA-LGG", type = "Clinical")
lgg_clin <- GDCquery_clinic(project = "TCGA-LGG", type = "Clinical")
clinical <- plyr::rbind.fill(gbm_clin,lgg_clin)
head(clinical)

Выше показан реалистичный вывод (усечено ниже для экономии места):

head (клинический) submitter_idification_of_tumor last_known_disease_status updated_datetime primary_diagnosis tum_stage age_at_diagnosis 1 TCGA-02-0001 не сообщается не сообщается 2018-09-06T13: 49: 07.196637-05: 00 глиобластома не сообщается 16179 2 TCGA-02-0003 не сообщается не сообщается 2018-09-0613: 07.196637-05: 00 Глиобластома не сообщается 18341 3 TCGA-02-0004 не сообщается не сообщается 2018-09-06T13: 49: 07.196637-05: 00 Глиобластома не сообщается 21617

При следующем кодевыполняется для получения клинических данных вторым способом, то есть из клинических XML-файлов:

query <- GDCquery(project = "TCGA-GBM"
                 ,data.category = "Clinical"
                 ,barcode = c("TCGA-08-0516"
                             ,"TCGA-02-0317"
                             )
                 )
GDCdownload(query)
clinical <- GDCprepare_clinic(query, clinical.info = "patient")
head(clinical)

... следующий вывод (желтым) и возвращается ошибка (в сером разделе):

GDCdownload (запрос) Загрузка данных для проекта TCGA-GBM с использованием URL-адреса 'https://gdc.cancer.gov/system/files/authenticated%20user/0/gdc->> client_v1.3.0_Windows_x64ZIP-файл 'Тип содержимого' application / zip 'длина 16576709 байт (15,8 МБ) загружено 15,8 МБ GDCdownload загрузит: 2,557335 МБ Запуск клиента GDC с помощью следующей команды: C: \ MyDir \ gdc-client.exe загрузить -m gdc_manifest.txt100% [###################################################] Время: 0:00:00 1,33 б / с 100% [###################################################] Время: 0:00:00 315,34 кБ / с 100% [#############################################] Время: 0:00:00 109,00 кБ / с 100% [#############################################] Время: 0:00:00, 3,56 кБ / с, 100% [#############################################] Время: 0:00:00 258,15 кБ / с100% [###################################################] Время: 0:00:03 869,38 б / с 100% [#############################################] Время: 0:00:00 319,63 кБ / с 100% [#############################################] Время: 0:00:00 830,89 кБ / с Успешно загружено: 9

Error in move(i, file.path(path, i)) :
I could not find the file: c9cdbc76-105d-429b-9fce-f000819716f9
clinical <- GDCprepare_clinic(query, clinical.info = "patient")
Error in GDCprepare_clinic(query, clinical.info = "patient") : 
I couldn't find all the files from the query.Please check directory parameter right

Вроде как тамданные в «клинической» и основаны на беспорядке «Успешно загружено: 9»В то время как кажется, что где-то должны быть данные, мне интересно, как получить GDCprepare_clinic (), чтобы избежать ошибки, чтобы продолжить.

Заранее спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...