Этот вопрос связан с пригодностью различных механизмов баз данных для исследований в области ИК и...
Я проводил мозговой штурм в рамках проекта бакалавриата в области вопросов и ответов.Проект,...
Я искал нормализацию оценки в течение нескольких дней (, теперь я знаю, что этого нельзя сделать )...
Я использую nutch1.3 для сканирования какой-либо веб-страницы и solr для создания каждого индекса....
У нас есть реализация проверки орфографии, основанная на расстоянии Левенштейна . Поскольку мы не...
У меня есть набор документов, который выглядит следующим образом: <doc> text sample text...
Я хотел бы задать вопросы о персонализированном поиске.Я собираюсь спроектировать / реализовать...
У меня есть модель языка униграмм, и я хочу сгладить счет.Это только один способ сглаживания, или я...
Какова лучшая модель для определения темы в коротких неструктурированных документах, напр.СМС или...
Я ищу библиотеку Java, которая может распознавать именованные объекты (NER) с настраиваемым...
Я ищу простой скрипт, который может найти частоты слов для данного документа (возможно, с помощью...
Я хочу взять то, о чем люди болтают в чате, и выполнить следующий поиск информации: Получить...
Некоторое время назад я натолкнулся на расширенную логическую модель , которая сочетает логическую...
Представьте, что у меня есть огромная база данных тем и сообщений (около 10.000.000 записей) с...
Я использую Java и Jsoup для разбора HTML-страниц и хочу получить все div, которые не содержат...
Обновление Кажется, что Boilerpipe работает очень хорошо, но я понял, что мне не нужен только...
В логической модели поиска запрос состоит из терминов, которые объединяются с помощью различных...
Я использую эластичный поиск и не совсем понимаю, что такое индекс.Например, если у меня есть 3...
Мне нужно вычислить сходство запроса и документа в Lucene, используя сходство Жакара по n-граммам
Я ищу быструю реализацию в памяти общего инвертированного индекса.Все, что мне нужно, это хранить...
У меня простой (может быть, глупый) вопрос.Я хочу рассчитать расхождение Кульбака – Лейблера по...
я строю мини-систему ответов на вопросы в C #. Мне нужно получить документ с помощью поиска Google....
Этот вопрос относится к группировке / кластеризации аналогичных документов в поиске информации. У...
Я использую этот код для извлечения исходного кода htm веб-страницы: private static string...
Я разрабатываю систему обнаружения контекста, которая представляет собой смесь поиска и предложений