Как получить значение индекса, соответствующее максимальному значению для определенного столбца - PullRequest
0 голосов
/ 16 октября 2019

У меня есть набор данных uber_data, имеющий столбцы как [START_DATE *, END_DATE * CATEGORY *, START *, STOP *, MILES *], где START * - начальное местоположение, а STOP * - конечное местоположение. Я должен получить наиболее частый маршрут, по которому ездит Uber Driver.

А ниже приведен код, который я использую для получения требуемого.

uber_data [['START *','STOP *', 'START_DATE *']]. Groupby (['START *', 'STOP *']). Count (). Max ()

Получается числомаршруты, которые должны быть 201. Но я не мог понять, как получить комбинацию, для которой наступает этот 201. Я должен вручную просмотреть данные, чтобы узнать комбинацию, которая выглядит как Агнью-Кэри

Я хочу, чтобы мой вывод был таким образом

** START * STOP * START_DATE *

Agnew Cary 201 **

Я пытался получить значение с помощью index (), но не получил желаемого результата.

1 Ответ

0 голосов
/ 16 октября 2019

используйте

 uber_data.groupby(['START*','STOP*'])['START_DATE*'].count().sort_values(ascending=False).head(1)

, что должно дать вам как индекс, так и значение

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...