Я пытаюсь повторить процесс, опубликованный здесь: https://dockflow.org/workflow/tcga//
Опубликованный код прекрасно работает до раздела, говорящего: клинические данные могут быть получены с использованием TCGAbiolinks двумя способами.Первый метод загрузки проиндексированных клинических данных GDC работает, как и ожидалось:
lgg_clin <- GDCquery_clinic(project = "TCGA-LGG", type = "Clinical")
lgg_clin <- GDCquery_clinic(project = "TCGA-LGG", type = "Clinical")
clinical <- plyr::rbind.fill(gbm_clin,lgg_clin)
head(clinical)
Выше показан реалистичный вывод (усечено ниже для экономии места):
head (клинический) submitter_idification_of_tumor last_known_disease_status updated_datetime primary_diagnosis tum_stage age_at_diagnosis 1 TCGA-02-0001 не сообщается не сообщается 2018-09-06T13: 49: 07.196637-05: 00 глиобластома не сообщается 16179 2 TCGA-02-0003 не сообщается не сообщается 2018-09-0613: 07.196637-05: 00 Глиобластома не сообщается 18341 3 TCGA-02-0004 не сообщается не сообщается 2018-09-06T13: 49: 07.196637-05: 00 Глиобластома не сообщается 21617
При следующем кодевыполняется для получения клинических данных вторым способом, то есть из клинических XML-файлов:
query <- GDCquery(project = "TCGA-GBM"
,data.category = "Clinical"
,barcode = c("TCGA-08-0516"
,"TCGA-02-0317"
)
)
GDCdownload(query)
clinical <- GDCprepare_clinic(query, clinical.info = "patient")
head(clinical)
... следующий вывод (желтым) и возвращается ошибка (в сером разделе):
GDCdownload (запрос) Загрузка данных для проекта TCGA-GBM с использованием URL-адреса 'https://gdc.cancer.gov/system/files/authenticated%20user/0/gdc->> client_v1.3.0_Windows_x64ZIP-файл 'Тип содержимого' application / zip 'длина 16576709 байт (15,8 МБ) загружено 15,8 МБ GDCdownload загрузит: 2,557335 МБ Запуск клиента GDC с помощью следующей команды: C: \ MyDir \ gdc-client.exe загрузить -m gdc_manifest.txt100% [###################################################] Время: 0:00:00 1,33 б / с 100% [###################################################] Время: 0:00:00 315,34 кБ / с 100% [#############################################] Время: 0:00:00 109,00 кБ / с 100% [#############################################] Время: 0:00:00, 3,56 кБ / с, 100% [#############################################] Время: 0:00:00 258,15 кБ / с100% [###################################################] Время: 0:00:03 869,38 б / с 100% [#############################################] Время: 0:00:00 319,63 кБ / с 100% [#############################################] Время: 0:00:00 830,89 кБ / с Успешно загружено: 9
Error in move(i, file.path(path, i)) :
I could not find the file: c9cdbc76-105d-429b-9fce-f000819716f9
clinical <- GDCprepare_clinic(query, clinical.info = "patient")
Error in GDCprepare_clinic(query, clinical.info = "patient") :
I couldn't find all the files from the query.Please check directory parameter right
Вроде как тамданные в «клинической» и основаны на беспорядке «Успешно загружено: 9»В то время как кажется, что где-то должны быть данные, мне интересно, как получить GDCprepare_clinic (), чтобы избежать ошибки, чтобы продолжить.
Заранее спасибо.