Автоматизировать выбор значений на основе процентилей - PullRequest
0 голосов
/ 20 сентября 2019

Я хочу, чтобы мой фрейм данных был разделен на разные группы на основе моего процентиля, а не значения процентиля

Я могу разделить, используя следующий код

  1. Получитьпроцентиль с использованием кода

    df.quantile(np.linspace(.1,1,9,0))
    
  2. На основе значений процентиля я разделил набор данных.

Пример:

1-я категория - значения <значение 20-го процентиля =125,8 </p>

2-я категория - это диапазоны значений между значениями 20-го и 40-го процентиля, т. Е. 125,8 и 190,0, аналогично 5 категориям

Используемый код

def call(row):
    if row["Calls"]<125.8:
        return "1"
    elif row["Calls"]>125.8 and row["Calls"]<=190.0:
        return "2"
    elif row["Calls"]>190.0 and row["Calls"]<=235.0:
        return "3"
    elif row["Calls"]>235.0 and row["Calls"]<=304.4:
        return "4"
    else: 
        return "5" 

Я хочу свой код Pythonследует разделить категории на основе процентилей вместо того, чтобы находить процентильные значения, а затем классифицировать на основе этого.

Пример:

Категория "1" метрики "Вызов" - это значения <20-й процентиль </p>

Категория "2" метрики "Вызов" - это значения между> 20 и 40процентиль

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...