В контексте проекта «Машинное обучение» я подошел к теме R, в которой я должен работать над общедоступным набором данных ЭЭГ.Вот ссылка на данные с описанием.
Набор данных базы данных ЭЭГ
Мне удалось успешно извлечь 122 испытуемых с соответствующими экспериментами в отдельные папки и создать списокиз всех этих папок в R. Но теперь у меня есть следующая проблема: Каждая из 122 папок содержит различное количество испытаний, которые упакованы в виде файла [PROBAND_ID].rd.[TRIAL_NUMBER].gz
(например, co2a0000364.rd.010.gz
, co2a0000364.rd.015.gz
или co2a0000364.rd.032.gz
).
Теперь я хотел бы прочитать в отдельных экспериментах 122 испытуемых таким образом, чтобы я мог использовать их как значимую структуру в R.
Так как же можно читатьфайлы .rd. [COUNT] .gz для каждой папки тестового человека и имеют ли они в виде структур R в моем проекте?Если структура данных играет роль, описание данных можно просмотреть по вышеуказанной ссылке, и вот пример:
Информация об атрибутах:
Каждое испытаниехранится в своем собственном файле и появится в следующем формате.
# co2a0000364.rd
# 120 испытаний, 64 канала, 416 образцов 368 образцов post_stim
# 3.906000 мсек * UV
# S1 obj, испытание 0
# FP1 chan 0 0 FP10 -8.921 0 FP1 1 -8.433 0 FP1 2 -2.574 0 FP1 3 5.239 0 FP1 4 11.587 0 FP1 5 14.028 ...
Первые четыре строки представляют информацию заголовка.Строка 1 содержит идентификатор субъекта и указывает, был ли субъект четвертым письмом субъектом алхолика (а) или контроля (с).Строка 4 идентифицирует условия сопоставления: показывается один объект (S1 obj), объект 2, показанный в состоянии сопоставления (соответствие S2), и объект 2, показанный в несоответствующем состоянии (соответствие S2).
В строке 5 указывается начало данных с датчика FP1.Четыре столбца данных: номер испытания, положение датчика, номер образца (0-255) и значение датчика (в микровольтах).