Я - аспирант по неврологии.После того, как я расспросил других докторов наук и постдоков и провел обширный поиск в Интернете, мне все еще неясно, как лучше организовать данные в моем проекте, чтобы их можно было
1) искать, например, я могу запросить: КСВ (электрофизиологический феномен), крыса, мышь post_op_d4 ИЛИ, Score_4_ataxia, theta_oscillation и возможность видеть соответствующие биты нейронных данных
2) легко доступны даже после того, как я покину лабораторию
Iнеобходимо объединить 5 категорий данных
1) Животное (.csv): показатели благосостояния животных, положение тетроды, поведенческие характеристики
2) Поведение (.mat, .jaab): траектории на аренеи результаты классификации поведения из помеченных кадров из видео.
3) Экспериментальные характеристики: условие, импульсы TTL для начала и смещения стимула, триггер для начала и конца испытания (не совпадает с представлением стимула)время)
4) Нейронные данные записи (.mcd, проприетарный формат): огромные файлы, разбитые на кускиначало испытаний во время сбора данных, но их необходимо объединить для анализа
5) графики обработанных данных - настройка кривых для каждого нейрона, гистограмма занятости для областей дорожки и т. д.
Теперь дополнительная трудность заключается в том, что нейронные данные требуют интенсивной постобработки, очистки и сортировки скачков.Сортировка Spike создает еще одну кучу файлов проприетарных форматов.
Вопрос двоякий: 1. Хранение: как лучше организовать данные, чтобы упростить анализ и поиск?За животное?В день?На клетку?
mouse1 === day2 === cell1 == spikes === figure
day2 === mouse1 === cell1 === spikes === figure
cell1 === day2 === spikes === цифры (клетки обычно могут быть записаны за один день)
В анализе мне нужен легкий доступ к данным по животному и по клетке.
Вы могли бы подумать, что нейробиологи уже поняли это, но нет, по крайней мере, не в моем отделении.
Управление Какой лучший формат программы / файла для этого?Я кружил около 2 вариантов
2.1.SQL - Python
2.2.HDF5 с множеством тегов и дополнительных меток
Дополнительное предупреждение: на данный момент сбор данных выполняется с помощью Matlab, а анализ сортировки после всплеска выполняется в Python.
Я просто надеюсь, чтосообщество программистов, которое не увязло в содержании файлов, может увидеть эту довольно тривиальную проблему с большей ясностью, чем я и мои коллеги до сих пор справились.