как определить точку отсечения в распределении температуры? - PullRequest
0 голосов
/ 07 мая 2020

У меня в данных есть температурная переменная. Я хочу исключить дни с самой высокой температурой. Причина исключения самых жарких дней заключается в том, что эти самые жаркие дни не искажают реальную связь с результатом.

Для этого я хочу посмотреть на распределение температуры, выбрать самую высокую температуру, а затем определить точку отсечения, в которой данные становятся все более и более разреженными.

Мой вопрос: нужно ли мне вручную смотреть на распределение температуры в R и определять точки отсечки? (критерий для точки отсечения: где данные становятся все более и более разреженными)?

Мои данные выглядят так. При этом 25,3 - самая высокая температура. Как я могу определить, где данные ниже становятся более разреженными? что может быть точкой отсечки в следующем примере?

    13.7
    14.1
    15.0
    15.4
    15.2
    14.9
    15.0
    15.5
    17.4
    20.0
    20.9
    20.7
    23.1
    25.3
    24.0
    19.8
    17.3
    19.1
    21.8
    23.0
    23.7
    23.0
    22.2
    20.4
    18.1
    17.2
    16.4
    16.6
    17.5
    18.9
    20.0
    20.1
    22.4

Что на самом деле означает «разреженный»? это там, где данные начинают становиться все шире и шире?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...