Отсутствует предупреждение о данных R - PullRequest
0 голосов
/ 20 мая 2019

У меня есть данные с климатическими значениями, такими как температура_макс, температура_мин ... в разных местах. Сбор данных - это данные временного ряда. Существуют определенные дни, в которые регистрация не производится. Я хотел бы вписать, принимая во внимание дату и место (переменная места в кадре данных)

Я пытался вменять эти пропущенные значения с помощью amelia. Но никакое вменение не делается с предупреждающей информацией

Проверка переменных:

head(df): PLACE, DATE, TEMP_MAX, TEMP_MIN, TEMP_AVG

PLACE    DATE        TEMP_MAX      TEMP_MIN     TEMP_AVG
F      12/01/2007       19.7         2.5          10.1
F      13/01/2007       18.8         3.5          10.4
F      14/01/2007       17.3         2.4          10.4
F      15/01/2007       19.5         4.0          9.2
F      16/01/2007       
F      17/01/2007       21.5         2.8          9.7
F      18/01/2007       17.7         3.3          12.9
F      19/01/2007       18.3         3.8          9.7
A      16/01/2007       17.7         3.4          9.7
A      17/01/2007       
A      18/01/2007       19.7         6.2          10.4
A      19/01/2007       17.7         3.8          10.1
A      20/01/2007       18.6        3.8          12.9

Это только некоторые из записей моего набора данных.

DF = amelia(df, m=4, ts= c("DATE"), cs = c("PLACE")) 

где DATE - данные временного ряда (01/01/2001, 02/01/2001, 03/01/2001 ...), но если отфильтровать по PLACE, временной ряд не будет равен (не та же звезда и конец время).

У меня есть 3 вопроса:

  1. Я не уверен, должен ли я иметь полные данные временных рядов для всех мест, я имею в виду одинаковое время начала и окончания для всех мест.

  2. Я не использую лаги или временные параметры, правильно ли я вписываюсь с учетом влияния временных рядов? Я не уверен, как использовать параметр задержки, хотя я проверил информацию о пакете R.

  3. Последний вопрос: когда я пытаюсь использовать этот код, появляется предупреждение и вменение не производится.

Предупреждение: в данных отсутствуют данные, которые полностью отсутствуют. Эти наблюдения останутся не вписанными в окончательные наборы данных.

- Вменение 1 -

В загруженном образце отсутствуют пропущенные данные: цепь EM не нужна

- Вменение 2 -

В загруженном образце отсутствуют пропущенные данные: цепь EM не нужна

- Вменение 3 -

Нет отсутствующих данных в загруженном образце: ненужная цепочка EM

- Вменение 4 -

В загруженном образце отсутствуют пропущенные данные: ненужная цепочка EM

Может кто-нибудь помочь мне с этим?

Большое спасибо за ваше время!

1 Ответ

0 голосов
/ 05 июня 2019
  1. Для программного обеспечения не имеет значения, если у вас разные даты начала и окончания для разных мест.Я думаю, что это зависит от вас и ваших мыслей о данных.Я хотел бы спросить себя, были ли эти данные пропущены (пропущены случайно), поэтому я бы создал пустые строки в вашем наборе данных или нет.

  2. Вы хотите использовать лаги, чтобы использовать прошлыезначения переменной, чтобы улучшить прогнозирование пропущенных значений.Это не обязательно (т. Е. Функция может вменять недостающие данные даже без такой спецификации), но может быть полезной.

  3. Я связался с автором пакета, и он сказал, что вынеобходимо указать аргументы splinetime или polytime, чтобы Amelia использовала информацию временных рядов для вменения.Например, если вы установите polytime = 3, он будет вменяться на основе кубического времени.Если вы сделаете это, я думаю, вы больше не увидите эту ошибку.

...