Замена значений в столбце частотой вхождения в том же столбце в excel / sql / pandas - PullRequest
1 голос
/ 20 февраля 2020

У меня есть таблица, которая содержит более 600000 записей и столбец с именем Implementer_userid, значение в котором может повторяться для более чем одной записи. Теперь я хочу сохранить, сколько раз в этом столбце встречается определенное значение. COUNTIF (Excel), GroupBy (sql) и подобные функции не будут работать, так как я не хочу подсчета определенного значения c и вместо этого заменяет все отдельные значения их частотами. Помогите мне сделать это в любой из трех платформ: Excel, Pandas (Python) и SQL.

enter image description here

1 Ответ

1 голос
/ 20 февраля 2020

Если я правильно понимаю вашу проблему, вы можете просто построить таблицу частот, используя функцию value_counts (), а затем go через ваш столбец, заменив ключи (значения строк) соответствующими частотами, полученными из словаря, который вы ' мы построили ранее. Например:

frequencies = your_pandas_dataframe['Your column'].value_counts()
your_pandas_dataframe['Result column'] = your_pandas_dataframe['Your column'].apply(lambda x: frequencies[x])

Если вам не нужен этот дополнительный столбец, вы, вероятно, можете сделать что-то вроде этого:

# ...
your_pandas_dataframe['Your column'] = your_pandas_dataframe['Your column'].apply(lambda x: frequencies[x])

Это отвечает на ваш вопрос?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...