Как передать пространственно-временные данные в модели склеарна? - PullRequest
0 голосов
/ 14 декабря 2018

Я новичок в машинном обучении и пытаюсь освоить свои первые шаги с помощью scikit-learn.Я хотел бы рассчитать интерполяцию, основанную на данных пространственно-временного датчика.У меня есть большее количество измерительных станций, которые измеряют данные одновременно (ежечасно).Для каждой измерительной станции у меня есть уникальная координата (X, Y, Z).Таким образом, мои измеренные / фиксированные значения для каждой измерительной станции состоят из:

     Timestamp,          X,           Y,        Z,   Value + Possible further values
2018-05-04 00:00:00, 32362422.00, 5656123.00, 54.28, 4.28, ..
2018-05-04 00:00:00, 32365418.00, 5656413.00, 72.47, 3.12, ..
2018-05-04 00:00:00, 32360290.00, 5656973.00, 51.11, 2.50, ..
...
2018-05-04 01:00:00, 32362422.00, 5656123.00, 54.28, 4.53, ..
2018-05-04 01:00:00, 32365418.00, 5656413.00, 72.47, 3.27, ..
...

(train data)

(все данные доступны в виде файла CSV).

Я хочу интерполировать значения для координат между моими измерительными станциями,Конечно, интерполируемые значения должны зависеть от новых значений, еще не известных модели

Sensor Data again
2018-05-22 16:00:00, 32362422.00, 5656123.00, 54.28, 0.29, ..
2018-05-22 16:00:00, 32365418.00, 5656413.00, 72.47, 1.12, ..
2018-05-22 16:00:00, 32360290.00, 5656973.00, 51.11, 0.73, ..
... -> All Measurements

New data to be interpolated in a grid:
2018-05-22 16:00:00, 32362500.00, 5656150.00, 55.81, ?, ..
2018-05-22 16:00:00, 32362500.00, 5656200.00, 56.44, ?, ..
...
(interpolation data)

. Для расчета я хотел бы использовать регрессор случайных лесов.

Однако яЯ немного ошеломлен:

  1. Как передать мои данные в виде суммированных блоков (с одинаковой меткой времени) в мою модель?

  2. Как сделатьЯ лучше всего проверю такие записи?Также для перекрестной проверки мои данные должны быть объединены?

Я очень благодарен за любой совет.Ответы также могут быть несколько подробными.Приветствия.

РЕДАКТИРОВАТЬ:

  1. Конечно, мои метки являются значения, измеренные станциями.

  2. Я пробовал горячее кодирование для каждой метки времени (равное время = та же группа).На следующем этапе я хочу предсказать значение для каждой координаты моей цифровой модели рельефа.

  3. Пока нет, я думал, что RF создаст самую простую / лучшую модель.Я попробую в следующий раз.

...