в python, я хочу найти в текстовом файле, который содержит список символов и его двоичное значение,...
Я пишу программу на python, которая находит наиболее похожие слова по заданному входному слову...
Я хочу выполнить кластеризацию, используя функцию hclust в R. Требуется матрица расстояний. Я хочу...
Допустим, у меня есть документы типа { "name": "John", "department":...
Я пытаюсь реализовать функцию подобия, используя N-грамм TF-IDF Cosine Similaity Пример Концепция:...
Поэтому я попытался использовать пакет tidytext для моделирования темы bigrams, выполнив шаги на...
Я довольно новичок в ElasticSearch. Я пробовал большинство учебников и посмотрел на форуме, но я не...
Я не очень хорошо разбираюсь в проблеме поиска. Я действительно использовал только SQL с подобными...
У меня сейчас есть две языковые модели нграмм (model_A и model_B). они обучаются на основе...
Допустим, у меня есть два кадра данных ниже. В действительности оба кадра данных будут иметь около...
Elasticsearch Mapping PUT testindex { "settings": { "analysis": {...
Ниже приведено упругое сопоставление поиска с одним полем с именем хоста и другим полем с именем...
Я хочу создать чар-н-грамм размеров от 2 до 4. Это то, что у меня сейчас есть: from nltk import...
В моей программе я нахожу n-грамм и распечатываю, сколько их в наборе данных.https://en.wikipedia
Я использовал этот код и его генерирующие униграммы, биграммы, триграммы из данного текста.Но я...
Я проиндексировал некоторые данные с помощью анализатора nGram (который выдает только триграммы),...
Я пытался о том, как получить синонимы для слов, которые я передаю. Это легкий кусок пирога для...
Я с трудом пытаюсь обернуть голову вокруг библиотеки Lucene.Это то, что я до сих пор: public void...
Я использую LibSVM (в Java fwiw), чтобы классифицировать образцы текста в одну из двух категорий:...
Я хочу использовать ElasticSearch для поиска по именам файлов (не по содержимому файла). Поэтому...
В настоящее время я работаю над системой интеллектуального текстового SMS.Я хочу реализовать это,...
Я использую стандартное определение поля Solr ngram - <fieldType name="ngram"...
Я просто разбирался с идеей разбить большую группу текста на одно целое с помощью рекурсивного...
Я нашел это решение на SO, чтобы обнаружить n-граммы в строке: (здесь: Генерация N-граммы из...
Я использую Solr 3.5, но я столкнулся с проблемой.Я хочу сравнить каждую строку в файле1 со ссылкой...