Можно ли использовать CountVectorizer для определения того, появляется ли набор слов в корпусе...
Это может быть простой вопрос, но, очевидно, я получил пустой словарь для подбора в CountVectorizer...
Я использую счетчик векторов, чтобы применить сопоставление строк в большом наборе данных текстов.Я...
Этот вывод дает гистограмму со словом на оси х и его частотой на оси у.Однако я хочу добавить два...
Имеет корпус, подобный этому: 'This is the first document.', 'This document is the...
Нужна помощь с ошибкой NameError: имя 'countVectorizer' не определено в PyCharm Я пытаюсь выполнить...
При попытке преобразовать разреженную матрицу в массив numpy (используя функцию toarray ), я...
У меня есть набор данных, в котором я должен предсказать строку на основе предыдущих двух строк. Я...
Я пытался использовать sklearn.countvectorizer, но это не сработало. Я использовал корпус с двумя...
Я успешно обучил и протестировал модель логистической регрессии с CountVectorizer() как таковым:...
Я пытаюсь установить набор данных, в котором есть столбцы event_type и notes (свободный текст)....
Я пытаюсь получить разреженную матрицу подсчета сроков огромного (~ 160.000) количества документов....
Есть ли способ получить tf и idf для атрибута stopwords_ атрибута TlefidfVectorizer (не стоп-слов)...
У меня есть код для добавления новой нетекстовой функции (длина документа) к векторизованному...
Я использую CountVectorizer из sklearn python lib для векторизации корпуса из файлов с...
В настоящее время у меня есть функция CountVectorizer CountVectorizer(stop_words=stopwords
Я сталкивался с этой проблемой при настройке набора данных. Все выглядит хорошо, не знаю, в чем...
Я пытаюсь добавить лематизацию в CountVectorizer из Skit-learn следующим образом import nltk from...
Я не хочу, чтобы члены длины были меньше 3 или больше, чем, скажем, 7. Существует простой способ...