Особенности последовательных измерений для классификации - PullRequest
0 голосов
/ 27 марта 2020

Я сейчас работаю над небольшим проектом машинного обучения. Задача касается медицинских данных пары тысяч пациентов. Для каждого пациента было проведено 12 измерений одного и того же набора показателей жизнедеятельности каждые один час. Эти измерения должны быть сделаны сразу после того, как пациент поступил в больницу, но могут начинаться с некоторого смещения. Однако в общей сложности пациент будет находиться в больнице 24 часа, поэтому он не может начать лечение позже, чем через 11 часов после поступления.

Теперь задача состоит в том, чтобы предсказать для каждого пациента, нет ли, одного или нескольких из 10 возможные тесты будут заказаны в течение оставшейся части пребывания, а также для прогнозирования будущего среднего значения некоторых показателей жизнедеятельности на оставшуюся часть пребывания. У меня есть тренировочный набор, который поставляется вместе с метками, которые я должен предсказать.

Мой вопрос в основном о том, как я могу обработать элементы, я думал о том, чтобы превратить результаты измерений для пациента в один длинный вектор и использовать это как учебный пример для классификатора. Однако я не совсем уверен, как мне следует включать информацию о времени каждого измерения в функции (я вообще должен учитывать время?).

1 Ответ

1 голос
/ 28 марта 2020

Если я правильно понял, вы хотите включить информацию о времени каждого измерения в функции. Один из способов, который я подумал, - создать пустой вектор длиной 24, так как пациент остается в больнице 24 часа. Тогда вы можете использовать одно горячее представление, например, если измерение было выполнено в 12-й, 15-й и 20-й часах его пребывания, ваш вектор временных характеристик будет иметь 1 в 12-й, 15-й и 20-й позиции, а все остальные равны нулю. Вы можете добавить этот вектор времени к другим объектам и создать для каждого пациента один вектор длины = длина (другой вектор) + длина (вектор времени). Или вы можете использовать разные подходы для объединения этих функций.

Пожалуйста, дайте мне знать, если вы считаете, что этот подход имеет смысл для вас. Спасибо.

...