Я ищу какие-то данные для проблемы временного ряда.
У меня есть данные о землепользовании за 2008-2018 годы. Каждая строка выглядит примерно так, где каждое значение обозначает использование земли определенной ячейки в следующем году:
[1.0, 2.0, 1.0, 3.0, 3.0, 3.0, 3.0, 3.0, 3.0, 3.0, 3.0]
Каждое число обозначает тип использования земли.
Однако иногдаэто выглядит так:
[1.0, 2.0, 1.0, 3.0, 3.0, 3.0, NaN, 3.0, 3.0, 3.0, 3.0]
А иногда это выглядит так:
[1.0, 2.0, 1.0, 3.0, 3.0, 3.0, 8.0, 3.0, 3.0, 3.0, 3.0]
Класс 3.0 = Густой лес, Класс 8.0 = Зона застройки
Обав случае NaN и непоследовательных переходов в землепользовании я хотел бы использовать что-то вроде статистического обучения, чтобы заполнить и скорректировать мои наблюдения с типом землепользования, который может происходить на основе предыдущего и прошлого землепользования.
RightТеперь я построил схему подсчета очков, в которой оцениваются предыдущие виды землепользования и прошлые виды землепользования (чем ближе к отсутствующим, тем тяжелее вес). Тип землепользования с наивысшим баллом затем заполняется для отсутствующего / противоречивого значения. Я все еще выясняю, как проверить работоспособность этой схемы.
В любом случае схема подсчета очков немного произвольна, я хотел бы получить некоторые данные для других идей, которые я мог бы попробовать. У меня все хорошо с питоном, но я все еще новичок в машинном обучении и вменениях.
Большое спасибо за ваши идеи!