Вопросы с тегом countvectorizer

0 голосов

1 ответ

Использование Sklearn's CountVectorizer для поиска нескольких строк не по порядку

Можно ли использовать CountVectorizer для определения того, появляется ли набор слов в корпусе...

Levi Huddleston / 26 октября 2018

0 голосов

0 ответов

CountVectorizer получает пустой словарный запас

Это может быть простой вопрос, но, очевидно, я получил пустой словарь для подбора в CountVectorizer...

Beginner / 26 октября 2018

0 голосов

1 ответ

получить непревзойденные слова после преобразования CountVectorizer

Я использую счетчик векторов, чтобы применить сопоставление строк в большом наборе данных текстов.Я...

Ameera / 22 октября 2018

0 голосов

1 ответ

Как отфильтровать по частоте и добавить в код биграммы?

Этот вывод дает гистограмму со словом на оси х и его частотой на оси у.Однако я хочу добавить два...

forthewin / 15 октября 2018

0 голосов

1 ответ

scikit-Learn CountVectorizer словарь с регулярным выражением

Имеет корпус, подобный этому: 'This is the first document.', 'This document is the...

Paris Karipidis / 09 октября 2018

0 голосов

1 ответ

Получение NameError: имя 'countVectorizer' не определено в Pycharm

Нужна помощь с ошибкой NameError: имя 'countVectorizer' не определено в PyCharm Я пытаюсь выполнить...

user10089194 / 03 октября 2018

0 голосов

0 ответов

Ошибка преобразования разреженной матрицы SciPy в пустой массив: «массив слишком большой»

При попытке преобразовать разреженную матрицу в массив numpy (используя функцию toarray ), я...

DannyMoshe / 03 октября 2018

0 голосов

0 ответов

Python Tuning Decision tree для определения весов на основе количества

У меня есть набор данных, в котором я должен предсказать строку на основе предыдущих двух строк. Я...

hemanth / 28 сентября 2018

0 голосов

1 ответ

Как использовать sklearn.countvectorizer?

Я пытался использовать sklearn.countvectorizer, но это не сработало. Я использовал корпус с двумя...

Code Monkey / 09 сентября 2018

0 голосов

1 ответ

Проблема с использованием `transform` против` fit_transform` в CountVectorizer

Я успешно обучил и протестировал модель логистической регрессии с CountVectorizer() как таковым:...

gannina / 24 августа 2018

0 голосов

1 ответ

CountVectorizer (): AttributeError: объект 'numpy.float64' не имеет атрибута 'lower'

Я пытаюсь установить набор данных, в котором есть столбцы event_type и notes (свободный текст)....

Raed / 03 июля 2018

0 голосов

1 ответ

CountVectorize словарная спецификация для биграмм Python

Я пытаюсь получить разреженную матрицу подсчета сроков огромного (~ 160.000) количества документов....

SAFEX / 03 июля 2018

0 голосов

0 ответов

sklearn TtfidfVectorizer stopwords_

Есть ли способ получить tf и idf для атрибута stopwords_ атрибута TlefidfVectorizer (не стоп-слов)...

Arman Didandeh / 10 июня 2018

0 голосов

0 ответов

Как задать имя для нетекстовой функции, добавляемой в преобразованные данные CountVectorizer?

У меня есть код для добавления новой нетекстовой функции (длина документа) к векторизованному...

Eugene Demianov / 04 июня 2018

0 голосов

2 ответов

sklearn / CountVectorizer: подгонка, затем преобразование с другим входным корпусом

Я использую CountVectorizer из sklearn python lib для векторизации корпуса из файлов с...

Mathieu Vigouroux / 24 мая 2018

0 голосов

1 ответ

Удалите числа и символы с помощью регулярных выражений на CountVectorizer

В настоящее время у меня есть функция CountVectorizer CountVectorizer(stop_words=stopwords

Ambigus9 / 07 мая 2018

0 голосов

1 ответ

TypeError: ожидаемая строка или байтовоподобный объект HashingVectorizer

Я сталкивался с этой проблемой при настройке набора данных. Все выглядит хорошо, не знаю, в чем...

Shahbaz Khan / 07 мая 2018

0 голосов

1 ответ

Лемматизация на CountVectorizer не удаляет стоп-слова

Я пытаюсь добавить лематизацию в CountVectorizer из Skit-learn следующим образом import nltk from...

Ambigus9 / 03 мая 2018

0 голосов

2 ответов

Как я могу ограничить длину токена при использовании CountVectorizer?

Я не хочу, чтобы члены длины были меньше 3 или больше, чем, скажем, 7. Существует простой способ...

Indi / 03 мая 2018