Вопросы с тегом н-грамм - PullRequest

Вопросы с тегом н-грамм

0 голосов
0 ответов

Мне нужно сделать автозаполнение в тексте, который содержит французские слова с дефисом, например...

Vincent Lopes Vicente / 11 декабря 2018
0 голосов
0 ответов

Я создал фильтры и анализаторы для моей эластичной базы данных.Могу ли я использовать их напрямую...

Amol Hegana / 10 декабря 2018
0 голосов
1 ответ

Я хочу выучить биграммы из корпуса, используя генсим, а затем просто распечатать изученные биграммы

Aviad Rozenhek / 09 декабря 2018
0 голосов
1 ответ

Я использую Lucene и хочу использовать nGrams со стоп-словами. Я написал собственный анализатор в...

Boendal / 04 декабря 2018
0 голосов
2 ответов

Приведенный ниже код разбивает предложение на отдельные токены, и вывод будет таким, как показано...

venkatttaknev / 03 декабря 2018
0 голосов
0 ответов

Я пытаюсь выполнить биграмный анализ на фрейме данных df со столбцом sentence, который в основном...

allmine / 01 декабря 2018
0 голосов
2 ответов

У меня есть БД Oracle.Logstash извлекает данные из Oracle и помещает их в ElasticSearch. Но когда...

Kiryl Aleksandrovich / 28 ноября 2018
0 голосов
0 ответов

Мне не удается экранировать символ + из строки запроса, я пробовал оба способа: 1) использовать \ и...

sumit / 28 ноября 2018
0 голосов
1 ответ

У меня есть список строк: corpus = ["Hello I am Sam", "This is a white desk"...

okuoub / 28 ноября 2018
0 голосов
0 ответов

enter code here https://pastebin.com/SzgXs5dD на основе прилагаемого кода, как я могу найти, какие...

nefeli / 28 ноября 2018
0 голосов
0 ответов

Я хотел бы понять разницу между моделями ARPA (например, в SRILM) и моделью word2vec (которая...

Sayantan / 22 ноября 2018
0 голосов
2 ответов

Я хочу написать скрипт Python, который ищет все строки Excel и возвращает 10 самых распространенных...

DJKarma / 19 ноября 2018
0 голосов
3 ответов

Предположим, есть следующее сопоставление с Edge NGram Tokenizer: { "settings": {...

m3th0dman / 10 ноября 2018
0 голосов
1 ответ

Я использую пакет "tm" для создания DocumentTermMatrix в R. Он хорошо работает для одного грамма,...

heisenbug47 / 08 ноября 2018
0 голосов
0 ответов

Эта строка кода ниже здесь, где gram_result будет использовать этот фрейм данных, который состоит...

School / 04 ноября 2018
0 голосов
0 ответов

Цель: Если у меня есть документ с заголовком The Hitchhikers Guide, при следующем поиске будет...

anon / 01 ноября 2018
0 голосов
0 ответов

Мой начальный фрейм данных: text n_gram_len 0 This is the best text 2 1 This is some other best...

Vishnudev / 01 ноября 2018
0 голосов
0 ответов

У меня есть эта функция, которую я хотел бы оптимизировать.Он будет проходить через тысячи строк. В...

lolo / 18 октября 2018
0 голосов
1 ответ

Я хотел бы создать список n-грамм, используя HiveQL.Моя идея состояла в том, чтобы использовать...

Flo / 12 октября 2018
0 голосов
2 ответов

У меня есть ключевое слово "гроссмейстер", и я ищу ключевое слово в огромном тексте.Мне нужно...

Raady / 09 октября 2018
0 голосов
0 ответов

Я тренирую bgram, триграмму: bgram = bigrams(sentences) trigram = trigrams(sentences) И хочу...

okuoub / 09 октября 2018
0 голосов
0 ответов

Я пишу SQL-запрос в Teradata TD16.Я пытаюсь сопоставить две сцепленные строки по NGrams (т.е....

Tired_Eyes / 27 сентября 2018
0 голосов
0 ответов

Моя цель - создать программу, которая принимает файл, читает его, анализирует его в токены и...

Miguel A. Friginal / 27 сентября 2018
0 голосов
0 ответов

У меня есть большой массив данных pandas (около 10 ГБ), который я хотел бы использовать для...

Tapal Goosal / 24 сентября 2018
0 голосов
1 ответ

Когда я использовал биграммы, я добавлял список биграмм к униграмме и использовал это в качестве...

JTa / 17 сентября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...