У меня есть вектор v1
в кадре данных df
.Просмотр данных с помощью summary(v1)
показывает следующее:
Min. 1st Qu. Median Mean 3rd Qu. Max.
0 7 16 15649 26 100000000
Я пытаюсь очистить данные и вижу, что около 2% значений равны 0 с помощью sum(df$v1==0)/nrow(df)
.Но когда я пытаюсь сделать то же самое для максимальных значений, я не получаю результатов:
sum(df$v1==100000000)/nrow(df)
[1] 0
Я знаю, что это не тот случай, поскольку как минимум 10 значений составляют 10 000 000 на
tail(sort(df$v1),10)
[1] 1e+08 1e+08 1e+08 1e+08 1e+08 1e+08 1e+08 1e+08 1e+08 1e+08
Любая идея, что происходит и как я могу увидеть количество экстремальных значений?Хранит ли R такие значения каким-то образом, о котором я не знаю (данные, скорее всего, получены из формул с делением на ноль)?