Я обучаю прогнозную модель текстовым описаниям и соответствующей им метке.Я использую SVC для...
Прежде всего, я новичок в НЛП, так что я мог понять концепцию неправильно или что-то в этом роде Я...
Я пытаюсь применить TF-IDF в столбце Pandas data all_cols 0 who is your hero and why 1 what do you...
Я пытаюсь применить SVM, используя функции tf-idf. но я получил эту ошибку: Traceback (most recent...
Есть этот код: feature_array = np.array(tfidf.get_feature_names()) tfidf_sorting = np
У меня есть корпус из 5000 названий книг, и я пытаюсь выполнить их кластеризацию. Я использую...
Я работаю над проблемой классификации данных Tweeter.Помеченные пользователем твиты (релевантные,...
У меня около 8000 объектов, измеряющих двухуровневую переменную отклика, т. Е. Выходные данные...
Почему значение векторизованного корпуса отличается от значения, полученного с помощью атрибута...
У меня есть список необработанных строк, которые выглядят следующим образом: listtocheck =...
Я пытаюсь выполнить двоичную классификацию, в которой входные данные (функции) представляют собой...
Я пытаюсь кластеризовать строки, используя Kmeans / EM.У меня есть список строк (около 70 строк), и...
У меня есть наивный байесовский классификатор, который классифицирует почту как спам или ветчину с...
Я пытаюсь сгруппировать похожие короткие описания вместе и в настоящее время использую ngrams для...
Я пытаюсь построить модель, которая помогает в классификации отчетов, и у меня есть только один...
Я хотел бы запустить модель LDA для извлечения тем. Для этого я хочу сначала создать биграммы, а...
tf-idf = частота термина * обратная частота документа частота термина определяется как счетчик...
Я немного запутался в концепции tf-idf. В обучающих данных мы используем fit_transform , чтобы...
Я хочу использовать классификатор sklearn для обучения модели, чтобы классифицировать записи данных...
Я использую tf-idf для текстовых данных, но не могу удалить слова длиной менее 3 символа . Я...
Попытка определить весовое значение с помощью TFIDF и count vectorizer Приведенный ниже код...
Предположим, у меня большой индекс, он состоит из 500 миллионов документов, и по умолчанию ES...
Я прошел [Теорию оценки релевантности] [1] и получил два связанных вопроса Q1: - Поскольку формула...
Я использую алгоритм TF-IDF для получения соответствующих документов с запросом, который я ввожу. Я...
Я прошел через Теорию оценки релевантности и получил один вопрос, но не смог найти ответ в Google...