Идеи для заполнения временных рядов (используя статистическое обучение?) - PullRequest
0 голосов
/ 16 октября 2019

Я ищу какие-то данные для проблемы временного ряда.

У меня есть данные о землепользовании за 2008-2018 годы. Каждая строка выглядит примерно так, где каждое значение обозначает использование земли определенной ячейки в следующем году:

[1.0, 2.0, 1.0, 3.0, 3.0, 3.0, 3.0, 3.0, 3.0, 3.0, 3.0]

Каждое число обозначает тип использования земли.

Однако иногдаэто выглядит так:

[1.0, 2.0, 1.0, 3.0, 3.0, 3.0, NaN, 3.0, 3.0, 3.0, 3.0]

А иногда это выглядит так:

[1.0, 2.0, 1.0, 3.0, 3.0, 3.0, 8.0, 3.0, 3.0, 3.0, 3.0]

Класс 3.0 = Густой лес, Класс 8.0 = Зона застройки

Обав случае NaN и непоследовательных переходов в землепользовании я хотел бы использовать что-то вроде статистического обучения, чтобы заполнить и скорректировать мои наблюдения с типом землепользования, который может происходить на основе предыдущего и прошлого землепользования.

RightТеперь я построил схему подсчета очков, в которой оцениваются предыдущие виды землепользования и прошлые виды землепользования (чем ближе к отсутствующим, тем тяжелее вес). Тип землепользования с наивысшим баллом затем заполняется для отсутствующего / противоречивого значения. Я все еще выясняю, как проверить работоспособность этой схемы.

В любом случае схема подсчета очков немного произвольна, я хотел бы получить некоторые данные для других идей, которые я мог бы попробовать. У меня все хорошо с питоном, но я все еще новичок в машинном обучении и вменениях.

Большое спасибо за ваши идеи!

1 Ответ

2 голосов
/ 16 октября 2019

Лучшим методом может быть не использовать статистическое обучение

  • Вменять с последним значением
  • Вменять со средним между последним и последующим непропущенным значением
  • Вменять ссреднее по скользящим окнам

Или вы можете попробовать линейную регрессию или моделирование на основе временных рядов (arima, LSTM, ...), но, опять же, я не уверен, что это лучшие методы. Вы должны попытаться оценить результат эмпирически.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...