Я недавно новичок в изучении Python (у меня уже 6 недель), и я не знаю, как атаковать это задание. Для этого задания мы получили набор данных Excel из Twitter и должны «очистить данные».
Я должен найти уникальные имена пользователей и количество раз, когда они твитнули в Твиттере (исключая ретвиты). и ответы) в наборе данных у вас есть. И найдите 10 самых популярных пользователей с самым частым количеством твитов (исключая ретвиты и ответы).
Я использую панд и не могу найти правильную строку кода, чтобы выполнить то, что янужно.
Мне удалось использовать этот код, чтобы отфильтровать всех пользователей, которые только отправили "Tweet". Это похоже на мой единственный прорыв.
df.loc[df['Relationship'] == "Tweet"]
В наборе данных есть столбец с именами пользователей «Users1» (т. Е. Их твиттер-дескрипторы) и столбец с именем «Отношения» (т. Е. Упоминание, ответы, твит). Это две колонки, с которыми я работаю.
К сожалению, я над головой и нуждаюсь в любой возможной помощи.
Спасибо
Редактировать:
print(df.User1.value_counts(['Relationship'] == "Tweet"))
Удалось немного продвинуться с этим кодом ^
Это действительно единственная строка кода, которую я нашел полу-полезной. Я болею больше часа.
Я приложил изображение части данных. Часть данных