Я использую LDA для данных, связанных со здоровьем.В частности, у меня есть ~ 500 документов,...
В практической функции оценки Lucene есть координатор запросов, который наказывает документы,...
После вычисления матрицы tf-idf мне нужно вычислить парное косинусное сходство, но я получаю ошибку...
Использование gensim: from gensim.models import TfidfModel from gensim.corpora import Dictionary...
Я векторизовал корпус, используя векторизатор TfIdf в sklearn. Корпус большой, но данные более или...
Я использую LETOR для создания информационно-поисковой системы. Они используют TF и IDF. Я уверен...
В каких случаях обратная частота документов бесполезна при поиске информации?
В моей БД есть таблица, содержащая столбец свободного текстового поля. Я хотел бы знать частоту...
Я должен создать набор данных из некоторых текстовых файлов, записав их как векторы функций....
Я заинтересован в кластеризации некоторых документов, и сейчас я рассматриваю возможность...
Мне нужно сравнить документы, хранящиеся в БД, и получить оценку сходства от 0 до 1. Метод, который...