Группировка столбцов объектов в Python - PullRequest
0 голосов
/ 28 июня 2019

Я делаю некоторый анализ, группируя определенные местоположения сайта по странам.

Вот кодовая часть:

results[["Site ID"]].groupby(["Country Code"]).sum()

Однако это не работает, поскольку идентификатор сайта столбца представляет собой буквенно-цифровое значение в виде DE123451 . Перед ним указан код страны, и его можно сгруппировать по столбцу «Название страны».

Объект с идентификатором сайта Количество клиентов с плавающей точкой

Если я пытаюсь сгруппировать его по количеству клиентов, вышеуказанный код работает. Я также пытался преобразовать столбец в столбец строки, но это не помогло вообще.

1 Ответ

0 голосов
/ 28 июня 2019
results[["Site ID"]].groupby(["Country Code"]).sum()

В первой части вы берете только столбец «Идентификатор сайта», поэтому столбец «Код страны» удаляется.

Попробуйте сгруппировать по «Коду страны», а затем взять столбец «Идентификатор сайта» и суммировать его (или вместо этого считать, если это то, что вы ищете.

# For Summing
results.groupby("Country Code")["Site ID"].sum()
# For Counting
results.groupby("Country Code")["Site ID"].count()
...