TfIdfVectorizer библиотеки superml работает неправильно - PullRequest
0 голосов
/ 20 апреля 2020

Я использую библиотеку superml (версия 0.4.0) (https://www.rdocumentation.org/packages/superml/versions/0.4.0)

df <- data.frame(sents = c('i am alone in dark.',
                       'mother_mary a lot',
                       'alone in the dark?',
                       'many mothers in the lot....'))
tf <- TfIdfVectorizer$new(smooth_idf = TRUE, min_df = 1, max_df=1)
tf_features <- tf$fit_transform(df$sents)

Код about взят из документации. Это лучше всего описывает мою проблему, хотя я использую другой набор данных. Fit_transform работает без проблем. Однако, когда я применяю функцию подгонки и затем выполняю преобразование, я получаю ошибку. Цель состоит в том, чтобы создать функции tf-idf на основе данных обучения, а затем использовать данные теста.

tf <- TfIdfVectorizer$new(smooth_idf = TRUE, min_df =1,max_df=1)
tf_features = tf$fit(df$sents)
tf$transform(df$sents)
>Error in colSums(tf) : 'x' must be an array of at least two dimensions
...