этот код прекрасно работает с идентификатором фильма, в котором есть ключевое слово plot. from imdb...
Я хочу получить ключевые слова сюжета для определенного идентификатора фильма, используя IMDBPY из...
Эффективно ли хранить частоту терминов и Idf как: term1: doc1, tf, doc2, tf, idf term2: doc1, tf,...
В практической функции оценки Lucene есть координатор запросов, который наказывает документы,...
Я хочу вычислить информацию о совпадении терминов в R. Я пытаюсь сделать это с помощью взаимной...
Использование gensim: from gensim.models import TfidfModel from gensim.corpora import Dictionary...
Привет, ребята, так что у меня есть эти текстовые файлы, как показано ниже: parent text \n -reply...
Я пытаюсь понять, как LDA можно использовать для извлечения текста, и в настоящее время я использую...
Я написал систему, которая суммирует длинный документ, содержащий тысячи слов.Существуют ли...
Я разрабатываю настольный продукт для Windows, для которого требуется библиотека индексирования...
я пытаюсь создать интеллектуальное приложение для поисковой системы, которое получает синонимы слов...
Мне было интересно, как создать базу данных отпечатков пальцев. Если отпечатки пальцев хранятся в...
В моем текущем проекте пользователи могут like песни, и теперь я собираюсь добавить поиск песни,...
Предположим, что показатель NDCG для моей поисковой системы равен 0,8.Как мне интерпретировать этот...
Я работаю над созданием инвертированного индекса с использованием Python. У меня есть некоторые...
Есть ли способ программно извлечь выделенный текст и заметки из файла PDF? Любой язык...
Я пытаюсь сравнить производительность различных запросов Solr.Чтобы получить честный тест, я хочу...
Я ищу систему поиска видео, код которой легко доступен, чтобы я мог ее изучить. Более того, я ищу...
У меня есть набор из 1000 страниц (ссылок), которые я получаю, отправляя запрос в Google.Я...
Я хотел бы вычислить сходство между текстовыми файлами лицензий, чтобы затем я мог на основании...
Я хочу знать, что можно использовать для определения релевантности страницы для такой темы, как...
Есть идеи, как создать lucene Document из строк, текстовых файлов или каталогов в новой версии...
Я работаю над проектом, который выполняет поиск в базе данных, а затем сортирует результаты поиска...
Я пытаюсь реализовать hunspell в люцене.Задача - сделать приложение, которое находит слова в PDF...
Мне нужно получить фрагменты из документов, в которых сопоставляются условия запроса, чтобы иметь...