SQL-запрос в пандах - PullRequest
       4

SQL-запрос в пандах

0 голосов
/ 17 февраля 2019

У меня SQL-запрос примерно такой:

display = pd.read_sql_query("""
SELECT UserId, ProductId, ProfileName, Time, Score, Text, COUNT(*)
FROM Reviews
GROUP BY UserId
HAVING COUNT(*)>1
""", con)

Может кто-нибудь помочь мне с эквивалентным кодом, используя только панд?

Я пытался:

cols = ['UserId', 'ProductId', 'ProfileName', 'Time', 'Score', 'Text']
df[cols].groupby('UserId').agg({'UserId':'count'})

Это не дает мне вывод, который я получаю из этого запроса.

Это набор данных: https://www.kaggle.com/snap/amazon-fine-food-reviews database.sqlite

Ответы [ 2 ]

0 голосов
/ 17 февраля 2019

, поскольку вы не предоставили никаких образцов данных

Возможный ответ:

df[cols].groupby('UserId').count()

0 голосов
/ 17 февраля 2019

Вы можете легко сделать это, используя групповую и счетную.

df.groupby('UserId').count().reset_index()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...