У меня есть pandas фрейм данных, который включает такие столбцы (среди прочего), где RATING - это целые числа от 0 до 5, а COMMENT - строка:
RATING COMMENT
1 some text
2 more text
3 other text
... ...
Теперь я хотел бы (из-за отсутствия лучшего слова) ключевые слова для списка строк:
list = ['like', trust', 'etc etc etc']
и хотел бы пройти через КОММЕНТАРИЙ и подсчитать количество ключевых слов по рейтингу, чтобы получить df out вот так
KEYWORD RATING COUNT
like 1 202
like 2 325
like 3 0
like 4 967
like 5 534
...
trust 1 126
....
как я могу этого добиться?
Я новичок, поэтому был бы очень признателен за вашу помощь (и чем проще и понятнее, тем лучше)
спасибо
привет, на данный момент я выполняю итерацию вручную, ie
#DATA_df is the original data
word_list = ['word', 'words', 'words', 'more']
values = [0] * len(word_list)
tot_val=[values]*5
rating_table = pd.DataFrame(tot_val, columns=word_list)
for i in len(word_list):
for g in len (DATA_df[COMMENT]):
if i in DATA_df[COMMENT][g]:
rating_table[i][DATA_df[RATING]-1] +=1
это дает такой DF
word words words more
0 0 0 0 0
1 0 0 0 0
2 0 0 0 0
3 0 0 0 0
4 0 0 0 0
, который я затем пытаюсь добавить к .... кажется действительно неуклюжим