Я создал фрейм данных на основе текстовой сводки, чтобы найти частоту документов (DF) и частоту обратных документов (IDF).
Вот столбцы с частотой документа и токенами слова -
Однако, когда я пытаюсь вычислить IDF для каждой строки в кадре данных, используя пользовательскую функцию, я получаю упомянутую ошибку.
Вот код для udf (который перебирает каждую строку) и функция (которая рассчитывает IDF)