Начинающий программист здесь ищет помощи. У меня есть Dataframe, который выглядит следующим образом:
Current
0 "Invest in $APPL, $FB and $AMZN"
1 "Long $AAPL, Short $AMZN"
2 "$AAPL earnings announcement soon"
3 "$FB is releasing a new product. Will $FB's product be good?"
4 "$Fb doing good today"
5 "$AMZN high today. Will $amzn continue like this?"
У меня также есть список со всеми хэштегами: cashtags = ["$AAPL", "$FB", $AMZN"]
По сути, я хочу пройти все строки в этом столбцеDataFrame и сохраните строки с уникальной кассовой меткой, независимо от того, есть ли она заглавными буквами, или удалите все остальные. Желаемый результат:
Desired
2 "$AAPL earnings announcement soon"
3 "$FB is releasing a new product. Will $FB's product be good?"
4 "$Fb doing good today"
5 "$AMZN high today. Will $amzn continue like this?"
Я попытался подсчитать, сколько раз слово появляется в строке, и добавить это значение в новый столбец, чтобы я мог удалить строки на основе числа.
for i in range(0,len(df)-1):
print(i, end = "\r")
tweet = df["Current"][i]
count = 0
for word in cashtags:
count += str(tweet).count(word)
df["Word_count"][i] = count
Однако, если я сделаю это, я буду удалять строки, которые мне не нужны. Например, строки, в которых уникальный денежный тег упоминается несколько раз ([3], [5])
Как мне достичь желаемого результата?