У меня есть столбец, который имеет только текст. Мне нужно извлечь ключевые слова из каждой строки, используя TFIDF.
Пример ввода:
df['Text']
'I live in India',
'My favourite colour is Red',
'I Love Programming'
Ожидаемый результат:
df[Text] df[Keywords]
'I live in India' 'live','India'
'My favourite colour is Red' 'favourite','colour','red'
'I Love Programming' 'love','programming'
Как мне это получить? Я попытался написать приведенный ниже код
tfidf = TfidfVectorizer(max_features=300, ngram_range = (2,2))
Y = df['Text'].apply(lambda x: tfidf.fit_transform(x))
Я получаю приведенную ниже ошибку Повторяемость по ожидаемым необработанным текстовым документам, получен строковый объект.