Я хочу, чтобы мой фрейм данных был разделен на разные группы на основе моего процентиля, а не значения процентиля
Я могу разделить, используя следующий код
Получитьпроцентиль с использованием кода
df.quantile(np.linspace(.1,1,9,0))
- На основе значений процентиля я разделил набор данных.
Пример:
1-я категория - значения <значение 20-го процентиля =125,8 </p>
2-я категория - это диапазоны значений между значениями 20-го и 40-го процентиля, т. Е. 125,8 и 190,0, аналогично 5 категориям
Используемый код
def call(row):
if row["Calls"]<125.8:
return "1"
elif row["Calls"]>125.8 and row["Calls"]<=190.0:
return "2"
elif row["Calls"]>190.0 and row["Calls"]<=235.0:
return "3"
elif row["Calls"]>235.0 and row["Calls"]<=304.4:
return "4"
else:
return "5"
Я хочу свой код Pythonследует разделить категории на основе процентилей вместо того, чтобы находить процентильные значения, а затем классифицировать на основе этого.
Пример:
Категория "1" метрики "Вызов" - это значения <20-й процентиль </p>
Категория "2" метрики "Вызов" - это значения между> 20 и 40процентиль