Вопросы с тегом н-грамм

0 голосов

0 ответов

Дефис в ребре N-грамм для эластичного поиска

Мне нужно сделать автозаполнение в тексте, который содержит французские слова с дефисом, например...

Vincent Lopes Vicente / 11 декабря 2018

0 голосов

0 ответов

Гнездовой запрос для эластичного n-граммового фильтра и анализатора

Я создал фильтры и анализаторы для моей эластичной базы данных.Могу ли я использовать их напрямую...

Amol Hegana / 10 декабря 2018

0 голосов

1 ответ

печатать биграммы с помощью gensim

Я хочу выучить биграммы из корпуса, используя генсим, а затем просто распечатать изученные биграммы

Aviad Rozenhek / 09 декабря 2018

0 голосов

1 ответ

Lucene Stopword и nGram

Я использую Lucene и хочу использовать nGrams со стоп-словами. Я написал собственный анализатор в...

Boendal / 04 декабря 2018

0 голосов

2 ответов

Есть ли в Spacy особенность двух или трех граммов?

Приведенный ниже код разбивает предложение на отдельные токены, и вывод будет таким, как показано...

venkatttaknev / 03 декабря 2018

0 голосов

0 ответов

соответствие строки и замена в биграмном анализе R

Я пытаюсь выполнить биграмный анализ на фрейме данных df со столбцом sentence, который в основном...

allmine / 01 декабря 2018

0 голосов

2 ответов

Как заставить Logstash заменить старые данные?

У меня есть БД Oracle.Logstash извлекает данные из Oracle и помещает их в ElasticSearch. Но когда...

Kiryl Aleksandrovich / 28 ноября 2018

0 голосов

0 ответов

не может убежать + в эластичном поисковом запросе

Мне не удается экранировать символ + из строки запроса, я пробовал оба способа: 1) использовать \ и...

sumit / 28 ноября 2018

0 голосов

1 ответ

Как обучить Ngram модель на моем собственном корпусе

У меня есть список строк: corpus = ["Hello I am Sam", "This is a white desk"...

okuoub / 28 ноября 2018

0 голосов

0 ответов

Часть речевого тегирования.Как я могу найти, какие пары тегер / набор тестов работают лучше?оценка

enter code here https://pastebin.com/SzgXs5dD на основе прилагаемого кода, как я могу найти, какие...

nefeli / 28 ноября 2018

0 голосов

0 ответов

Word2vec против модели ARPA N-грамм

Я хотел бы понять разницу между моделями ARPA (например, в SRILM) и моделью word2vec (которая...

Sayantan / 22 ноября 2018

0 голосов

2 ответов

Наиболее распространенные предложения извлечения с подсчетом с использованием Python

Я хочу написать скрипт Python, который ищет все строки Excel и возвращает 10 самых распространенных...

DJKarma / 19 ноября 2018

0 голосов

3 ответов

Elasticsearch Edge NGram токенайзер выше, когда слово начинается с n-граммы

Предположим, есть следующее сопоставление с Edge NGram Tokenizer: { "settings": {...

m3th0dman / 10 ноября 2018

0 голосов

1 ответ

Создать матрицу сроков документа с N-граммами в R

Я использую пакет "tm" для создания DocumentTermMatrix в R. Он хорошо работает для одного грамма,...

heisenbug47 / 08 ноября 2018

0 голосов

0 ответов

Как я могу улучшить результаты Ngrams?

Эта строка кода ниже здесь, где gram_result будет использовать этот фрейм данных, который состоит...

School / 04 ноября 2018

0 голосов

0 ответов

Elasticsearch: пример автозаполнения поиска с пробелами не работает

Цель: Если у меня есть документ с заголовком The Hitchhikers Guide, при следующем поиске будет...

anon / 01 ноября 2018

0 голосов

0 ответов

Создать n-грамм на основе значения в другом столбце для большого набора данных

Мой начальный фрейм данных: text n_gram_len 0 This is the best text 2 1 This is some other best...

Vishnudev / 01 ноября 2018

0 голосов

0 ответов

Быстрое внедрение N-Grams в Python

У меня есть эта функция, которую я хотел бы оптимизировать.Он будет проходить через тысячи строк. В...

lolo / 18 октября 2018

0 голосов

1 ответ

Как сгенерировать все n-граммы в Hive

Я хотел бы создать список n-грамм, используя HiveQL.Моя идея состояла в том, чтобы использовать...

Flo / 12 октября 2018

0 голосов

2 ответов

Как извлечь несколько перед словами после нахождения ключевого слова в тексте с помощью Python

У меня есть ключевое слово "гроссмейстер", и я ищу ключевое слово в огромном тексте.Мне нужно...

Raady / 09 октября 2018

0 голосов

0 ответов

НЛТК каль недоумение биграмма / триграммы

Я тренирую bgram, триграмму: bgram = bigrams(sentences) trigram = trigrams(sentences) И хочу...

okuoub / 09 октября 2018

0 голосов

0 ответов

NGram Query in SQL Optimize

Я пишу SQL-запрос в Teradata TD16.Я пытаюсь сопоставить две сцепленные строки по NGrams (т.е....

Tired_Eyes / 27 сентября 2018

0 голосов

0 ответов

Ngram Tokenizer для файлов в Java

Моя цель - создать программу, которая принимает файл, читает его, анализирует его в токены и...

Miguel A. Friginal / 27 сентября 2018

0 голосов

0 ответов

Нужен более быстрый метод добавления частых тестовых биграмм в тренировочный набор

У меня есть большой массив данных pandas (около 10 ГБ), который я хотел бы использовать для...

Tapal Goosal / 24 сентября 2018

0 голосов

1 ответ

При использовании триграмм в tf-idf следует ли включать униграммы и биграммы?

Когда я использовал биграммы, я добавлял список биграмм к униграмме и использовал это в качестве...

JTa / 17 сентября 2018