У меня есть датафрейм, где в каждой строке есть автор (новостной канал), название статьи и количество комментариев к этой статье.
По сути, я хочу рассчитать количество комментариев для каждогостатья. В настоящее время у меня есть следующий код, но я хочу его учесть.
# CSV of news articles, with authors, articles, and comments
df = pd.read_csv('articles.csv')
# Counts per author
art_count = df['AUTHOR'].value_counts()
# Calculate # of comments per article
def comment_sum(df, channel, channel_name, target):
# ex) sum(df[df['AUTHOR'] == 'NYTIMES']['COMMENTS'])
return sum(df[df[channel] == channel_name][target])
# Calculate # of comments
com_count = []
for newspaper in art_count.index:
com_count.append(comment_sum(df,'AUTHOR',newspaper,'COMMENTS'))
Мне кажется, что я могу упростить свой код, не объявляя метод, используя карту и лямбда-функцию, но я не уверен, как это сделать.