Все, что я пытаюсь сделать, это перебирать DataFrame и подсчитывать количество уникальных значений, используя группу панд по. Я также отсортировал фрейм данных безрезультатно.
Я испробовал 15 различных методов и прочитал каждую ветку вопросов / ответов, которую я могу найти, и я понятия не имею, почему она не работает.
Код для создания DF:
#list of queries is literally a python list of queries in no specified #order
user_queries = pd.DataFrame(list_of_queries)
user_queries = user_queries.rename(index=str, columns={0: "queries"})
# I only added the int 1 because pandas refused to just count the #queries themselves
user_queries["count"] = 1
Как это выглядит перед кодом группировки
queries count
1234 test 1
1234 test 1
user_queries["query_counts"] = user_queries.groupby("queries")["count"].nunique()
user_queries.head()
Как это должно выглядеть
| ,queries,count,query_counts|
|1234,test ,1 ,2 |
Но вместо "2" он дает мне NaN для каждого значения. Я чувствую, что упускаю что-то простое, но
В последнем столбце должна быть сумма столбца «count», сгруппированная по столбцу «query»