Вопросы с тегом тс-IDF - PullRequest

Вопросы с тегом тс-IDF

0 голосов
0 ответов

Я пытался найти сходство тысяч текстовых документов в одном запросе. И каждый размер документа в...

rkatkam / 24 октября 2019
0 голосов
1 ответ

Я читал некоторый код о НЛП и увидел, что X_test не имеет fit_transform при назначении (последняя...

user12261788 / 24 октября 2019
1 голос
1 ответ

Распространенным способом вычисления косинусного сходства между текстовыми документами является...

smkj33 / 23 октября 2019
1 голос
1 ответ

Я работаю с файлом, разделенным табуляцией, который выглядит следующим образом: 0 abch7619 Lorem...

Jerry M. / 21 октября 2019
0 голосов
2 ответов

Я новичок в кодировании на Python, поэтому выяснение того, как кодировать более сложные действия,...

Beginner_Learner19 / 18 октября 2019
0 голосов
0 ответов

Мой вопрос похож на , но я использую PySpark, и у него там не было решения. Мой фрейм данных df...

Rushdi Shams / 17 октября 2019
2 голосов
1 ответ

Проблема: использование scikit-learn для определения количества совпадений переменных n-грамм...

Berlines / 15 октября 2019
0 голосов
1 ответ

Я прочитал много блогов, но не был удовлетворен ответами. Предположим, я тренирую модель tf-idf на...

Shubham Bajaj / 14 октября 2019
0 голосов
1 ответ

Я хочу написать функцию, которая возвращает частоту каждого элемента в n-граммах данного текста....

Miss / 10 октября 2019
0 голосов
0 ответов

Итак, я читаю эту статью для реализации TF-IDF https://towardsdatascience

Miguel A. Friginal / 09 октября 2019
1 голос
0 ответов

Я думал, что .idf_ - это обратная частота документов , то есть это будет idf_(t) = log( N/ D(t))...

Martin Thoma / 08 октября 2019
0 голосов
1 ответ

Я соответствую своей модели MultinomialNB с K-кратным разделением. Я пытался сбалансировать данные...

Иван Позняк / 30 сентября 2019
1 голос
1 ответ

У меня есть функция для получения функции tfidf, например: def get_tfidf_features(data,...

John Bott / 30 сентября 2019
0 голосов
1 ответ

Я выбрал нормализованный TF-IDF, а также ключевое слово RDD и теперь хочу вычислить косинусное...

Ricky / 25 сентября 2019
0 голосов
0 ответов

Вот пример моего набора данных d = {'TEXT': ['History: A 59 year old female, was...

pari / 23 сентября 2019
3 голосов
1 ответ

Я создал фрейм данных разреженной матрицы, который взял значения в списке и установил их в качестве...

Jimmy / 23 сентября 2019
0 голосов
0 ответов

Я использую список , чтобы сохранить мой показатель частоты обратных документов (idf) в списке,...

Bilal Chandio / 21 сентября 2019
0 голосов
0 ответов

Я использую TF-idf, чтобы извлечь некоторые функции из текста, а затем обучить машину этому.после...

Mahdi Asiyabi / 21 сентября 2019
0 голосов
1 ответ

Я пытаюсь решить проблему с классификацией. Данные относятся к обзорам определенной категории...

Dhrub Satyam Jha / 20 сентября 2019
0 голосов
0 ответов

Я работаю с tf-idf и классификацией текста для ранжирования слов в документах.Мне было интересно,...

BNMC / 08 июля 2019
1 голос
2 ответов

Я пытался узнать оценки tf-idf каждого слова в моем документе.Однако он возвращает только значения...

shibangi barua / 06 июля 2019
6 голосов
1 ответ
0 голосов
1 ответ

Я хочу проверить косинусное сходство двух документов разной длины (скажем, один - один или два слоя...

shweta nayak / 04 июля 2019
0 голосов
0 ответов

import nltk from nltk.corpus import PlaintextCorpusReader from sklearn.feature_extraction.text...

kool / 04 июля 2019
0 голосов
1 ответ

Вот моя проблема: У меня есть такой фрейм данных: id tfidf_weights 1 {word1: 0.01, word2: 0.01,...

nipato / 03 июля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...