Как избежать «операции возможны только для числовых, логических или сложных типов» при вычислении трех лучших элементов в каждой группе - PullRequest
1 голос
/ 08 июля 2019

У меня есть матрица (AOD_median), которая содержит 4 столбца. Я хочу найти 3 самых больших элемента данных (по AOD) для каждого года и определить месяц, связанный с этими элементами. Это мои данные:

date      month year     AOD
1-Mar-00    3   2000    0.226
1-Apr-00    4   2000    0.454
1-May-00    5   2000    0.328
1-Jun-00    6   2000    0.314
1-Jul-00    7   2000    0.354
1-Aug-00    8   2000    0.282
1-Sep-00    9   2000    0.278
1-Oct-00    10  2000    0.183
1-Nov-00    11  2000    0.173
1-Dec-00    12  2000    0.21
1-Jan-01    1   2001    0.171
1-Feb-01    2   2001    0.281
1-Mar-01    3   2001    0.241
1-Apr-01    4   2001    0.269
1-May-01    5   2001    0.292
1-Jun-01    6   2001    0.222
1-Jul-01    7   2001    0.322
1-Aug-01    8   2001    0.268
1-Sep-01    9   2001    0.276
1-Oct-01    10  2001    0.169
1-Nov-01    11  2001    0.16
1-Dec-01    12  2001    0.15

и это dput текст:

structure(list(X1 = c("1-Mar-00", "1-Apr-00", "1-May-00", "1-Jun-00", 
"1-Jul-00", "1-Aug-00", "1-Sep-00", "1-Oct-00", "1-Nov-00", "1-Dec-00", 
"1-Jan-01", "1-Feb-01", "1-Mar-01", "1-Apr-01", "1-May-01", "1-Jun-01", 
"1-Jul-01", "1-Aug-01", "1-Sep-01", "1-Oct-01", "1-Nov-01", "1-Dec-01"
), X2 = c(3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 1, 2, 3, 4, 5, 6, 
7, 8, 9, 10, 11, 12), X3 = c(2000, 2000, 2000, 2000, 2000, 2000, 
2000, 2000, 2000, 2000, 2001, 2001, 2001, 2001, 2001, 2001, 2001, 
2001, 2001, 2001, 2001, 2001), X4 = c(0.226, 0.454, 0.328, 0.314, 
0.354, 0.282, 0.278, 0.183, 0.173, 0.21, 0.171, 0.281, 0.241, 
0.269, 0.292, 0.222, 0.322, 0.268, 0.276, 0.169, 0.16, 0.15)), class = c("tbl_df", 
"tbl", "data.frame"), row.names = c(NA, -22L))

Я попытался выполнить эту операцию со следующим кодом:

for(i in 2000:2001) {(d <- as.matrix(AOD_median[which(AOD_median[,3]==i),]))&
                     (order_AOD <- d[order(d[,4], decreasing = TRUE)])&
                      print(order_AOD[1:3,2])}

Я ожидал получить такой результат:

"4" "7" "5" 
"7" "2" "9"

Вместо этого я получил эту ошибку:

Error in (d <- as.matrix(AOD_median[which(AOD_median[, 3] == i), ])) &  : 
  operations are possible only for numeric, logical or complex types

1 Ответ

0 голосов
/ 08 июля 2019

Конкретная ошибка вызвана тем, что вы используете & для разделения строк кода; это не работает, потому что это логический оператор в R. Вы можете вместо этого использовать ; или символы новой строки для разделения строк.

Однако, делая шаг назад, вы пытаетесь вычислить верхние 3 месяца года для каждого года в вашем наборе данных, как измерено полем AOD. Поскольку вы используете dplyr, это можно сделать более гладко с помощью чего-то вроде:

AOD_median %>%
  arrange(-AOD) %>%
  group_by(year) %>%
  top_n(3, AOD) %>%
  select(year, month)
# A tibble: 6 x 2
# Groups:   year [2]
#    year month
#   <dbl> <dbl>
# 1  2000     4
# 2  2000     7
# 3  2000     5
# 4  2001     7
# 5  2001     5
# 6  2001     2

Если вы не возражаете против того, что три месяца вышли из строя (по данным AOD), вы можете опустить строку arrange(-AOD).

Данные:

AOD_median <- structure(list(date = c("1-Mar-00", "1-Apr-00", "1-May-00", "1-Jun-00", "1-Jul-00", "1-Aug-00", "1-Sep-00", "1-Oct-00", "1-Nov-00", "1-Dec-00", "1-Jan-01", "1-Feb-01", "1-Mar-01", "1-Apr-01", "1-May-01", "1-Jun-01",  "1-Jul-01", "1-Aug-01", "1-Sep-01", "1-Oct-01", "1-Nov-01", "1-Dec-01"), month = c(3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 1, 2, 3, 4, 5, 6,7, 8, 9, 10, 11, 12), year = c(2000, 2000, 2000, 2000, 2000, 2000, 2000, 2000, 2000, 2000, 2001, 2001, 2001, 2001, 2001, 2001, 2001,2001, 2001, 2001, 2001, 2001), AOD = c(0.226, 0.454, 0.328, 0.314,0.354, 0.282, 0.278, 0.183, 0.173, 0.21, 0.171, 0.281, 0.241, 0.269, 0.292, 0.222, 0.322, 0.268, 0.276, 0.169, 0.16, 0.15)), class = c("tbl_df", "tbl", "data.frame"), row.names = c(NA, -22L))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...