Странное поведение функции суммы - PullRequest
1 голос
/ 20 сентября 2019

У меня есть вектор v1 в кадре данных df.Просмотр данных с помощью summary(v1) показывает следующее:

Min.   1st Qu.    Median   Mean   3rd Qu.      Max. 
 0         7        16     15649     26      100000000

Я пытаюсь очистить данные и вижу, что около 2% значений равны 0 с помощью sum(df$v1==0)/nrow(df).Но когда я пытаюсь сделать то же самое для максимальных значений, я не получаю результатов:

sum(df$v1==100000000)/nrow(df)
[1] 0

Я знаю, что это не тот случай, поскольку как минимум 10 значений составляют 10 000 000 на

tail(sort(df$v1),10)
[1] 1e+08 1e+08 1e+08 1e+08 1e+08 1e+08 1e+08 1e+08 1e+08 1e+08

Любая идея, что происходит и как я могу увидеть количество экстремальных значений?Хранит ли R такие значения каким-то образом, о котором я не знаю (данные, скорее всего, получены из формул с делением на ноль)?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...