У меня есть датафрейм, содержащий предложение в строке. Мне нужно поискать в этих предложениях наличие определенных слов. Вот как я сейчас это делаю:
import pandas as pd
p = pd.DataFrame({"sentence" : ["this is a test", "yet another test", "now two tests", "test a", "no test"]})
test_words = ["yet", "test"]
p["word_test"] = ""
p["word_yet"] = ""
for i in range(len(p)):
for word in test_words:
p.loc[i]["word_"+word] = p.loc[i]["sentence"].find(word)
Это работает как задумано, однако, возможно ли это оптимизировать? Он работает довольно медленно для больших фреймов данных