Я сейчас работаю над небольшим проектом машинного обучения. Задача касается медицинских данных пары тысяч пациентов. Для каждого пациента было проведено 12 измерений одного и того же набора показателей жизнедеятельности каждые один час. Эти измерения должны быть сделаны сразу после того, как пациент поступил в больницу, но могут начинаться с некоторого смещения. Однако в общей сложности пациент будет находиться в больнице 24 часа, поэтому он не может начать лечение позже, чем через 11 часов после поступления.
Теперь задача состоит в том, чтобы предсказать для каждого пациента, нет ли, одного или нескольких из 10 возможные тесты будут заказаны в течение оставшейся части пребывания, а также для прогнозирования будущего среднего значения некоторых показателей жизнедеятельности на оставшуюся часть пребывания. У меня есть тренировочный набор, который поставляется вместе с метками, которые я должен предсказать.
Мой вопрос в основном о том, как я могу обработать элементы, я думал о том, чтобы превратить результаты измерений для пациента в один длинный вектор и использовать это как учебный пример для классификатора. Однако я не совсем уверен, как мне следует включать информацию о времени каждого измерения в функции (я вообще должен учитывать время?).