Я делаю классификацию текста, и у меня есть набор данных отзывов клиентов, который содержит...
Я делаю классификацию текста на 4 диалектах с countVectorizer и наивным байесом.У меня снижение...
Я не могу преобразовать число в строку, используя tfidvectorizer, даже после использования функции...
Я нахожу фильтрующие слова на основе их значений idf. У меня есть 36k слов в списке, и у меня есть...
У меня есть задача классификации текста, основанная на документах, где я ожидаю, что классы связаны...
Я создаю систему рекомендаций, и моя главная цель - рекомендовать место для публикации конференции,...
Я новичок в машинном обучении, начал с многослойной классификации текста.Я могу классифицировать...
Чтобы получить tfidf maxtrix, я обучил 50000 документов с помощью sklearn.feature_extraction.text
Я разработал вспомогательный инструмент, в котором конечный пользователь должен видеть компании,...
Я использую TfidfVectorizer () для преобразования текста в числовой вектор, который я могу...
Я занимаюсь анализом настроений и для генерации признаков из текста, я использую метод TF-IDF, но...
Я пытаюсь вычислить tf-idf выбранных слов в корпусе, но это не сработало, когда я использую...
В scikit-learn TfidfVectorizer позволяет нам соответствовать тренировочным данным, а затем...
У меня есть документ со многими отзывами.Я создаю пакет слов, используя TfidfVectorizer.Что я хочу...
Я хотел бы кластеризовать тексты из разных файлов по темам. Я использую набор данных из 20 групп...
Ожидаемые результаты и краткое изложение того, что я хочу сделать: 1. From one list, I have created...
Я сгенерировал облако слов из набора данных tfidf, но у меня есть разные словари в формате csv...
Я бы хотел сгруппировать текст из 20 групп новостей с библиотекой pycluster: https://codedocs
Я выбираю 5 лучших функций из X_train, используя feature_importances_. После получения индексов...
Я хочу найти релевантность некоторых слов (например, экономика, технология) в одном документе. В...
Я пытаюсь объединить два типа параметров перед кластеризацией. Мои параметры - Текст - представлены...
Мы загрузили обученную модель с использованием joblib в python, и в качестве входных данных для...
Как я могу проверить токенизированные строки внутри TfidfVertorizer()?Если я ничего не передам в...
Я использую следующий код, чтобы попытаться создать фрейм данных из векторизатора Tf-Idf.Вывод...
Я пытаюсь понять, как интерпретировать и согласовывать оценки TF-IDF из sklearn TfidfVectorizer.Для...