У меня есть информационный блок Data Gain и tf dataframe. данные выглядят так:
Усиление информации
Term IG
0 alqur 0.641328
1 an 0.641328
2 ayatayat 0.641328
3 bagai 0.641328
4 bantai 0.641328
5 besar 0.641328
Частота терминов
A B A+B
ahli 1 0 1
alas 1 0 1
alqur 0 1 1
an 0 1 1
ayatayat 0 1 1
... ... ... ...
terus 0 1 1
tuduh 0 1 1
tulis 1 0 1
ulama 1 0 1
upaya 0 1 1
Допустим, таблица информацииGain = IG и таблица tf = TF
Я хотел посчитать «термин» из IG, если «термин» содержится в TF «термин» и его значение класса (A / B) равно 1. Это похожедо COUNTIF(range_term, term)
в Excel, но я не знаю, как это сделать с пандами, или NumPy или что-нибудь еще.