Вопросы с тегом токенизировать - PullRequest

Вопросы с тегом токенизировать

0 голосов
1 ответ

Я использую Lucene и хочу использовать nGrams со стоп-словами. Я написал собственный анализатор в...

Boendal / 04 декабря 2018
0 голосов
2 ответов

Приведенный ниже код разбивает предложение на отдельные токены, и вывод будет таким, как показано...

venkatttaknev / 03 декабря 2018
0 голосов
0 ответов

Мне не удается экранировать символ + из строки запроса, я пробовал оба способа: 1) использовать \ и...

sumit / 28 ноября 2018
0 голосов
1 ответ

Как сделать стеммизация из Язык телугу с использованием Java Lucene?

Rahul Kumar / 27 ноября 2018
0 голосов
1 ответ

Я использую пакет "tm" для создания DocumentTermMatrix в R. Он хорошо работает для одного грамма,...

heisenbug47 / 08 ноября 2018
0 голосов
1 ответ

Проблема связана с: InvalidArgumentError (см. Выше для отслеживания): индексы [1] = 10 не в [0, 10)...

Henryk Borzymowski / 24 октября 2018
0 голосов
1 ответ
0 голосов
1 ответ

Я пытаюсь написать токенизатор для разбора текста (входной строки) с помощью регулярных выражений.Я...

John Pool / 14 октября 2018
0 голосов
1 ответ
0 голосов
1 ответ

Я пишу простую программу оболочки на C, где программа принимает команды от пользователя в командной...

Alexander Nenartovich / 13 сентября 2018
0 голосов
1 ответ

Я изучал использование R lime на наборах текстовых данных для объяснения предсказаний модели...

Lacri Mosa / 08 июня 2018
0 голосов
0 ответов

У меня есть файл данных csv с текстами песен, где каждая строка является предложением.Я могу...

lostpineapple45 / 16 мая 2018
0 голосов
1 ответ

Я проиндексировал некоторые данные с помощью анализатора nGram (который выдает только триграммы),...

rudi / 16 мая 2018
0 голосов
2 ответов

Я пытаюсь работать с tidytext, с файлом .txt с именем: texto_revision со следующей структурой: # A...

Samir Ricardo Neme Chaves / 11 мая 2018
2 голосов
1 ответ

Я с трудом пытаюсь обернуть голову вокруг библиотеки Lucene.Это то, что я до сих пор: public void...

John Russell / 01 апреля 2012
0 голосов
2 ответов

У меня есть программа, которая читает входные данные из файла.Я пытаюсь ограничить ввод, чтобы...

Miguel A. Friginal / 24 марта 2012
0 голосов
2 ответов
2 голосов
1 ответ

У меня есть следующие строки кода: public static void main(String[] args) { InputStreamReader...

LylyTran / 14 марта 2012
1 голос
3 ответов

public class driver { private static ArrayList<String> arrayList ; TownBankRecord TBR = new...

Nidhin_toms / 21 февраля 2012
0 голосов
3 ответов

[править] сообщение обновлено с исправленным XML и желаемым выводом, как описано в ответе и...

Daktari / 15 декабря 2011
1 голос
2 ответов

Я пытаюсь создать токенайзер строк, который может токенизироваться на нескольких символах. Я знаю,...

lavoy / 04 декабря 2011
2 голосов
2 ответов

Мне нужно написать регулярные выражения для соответствия некоторому токенизируемому тексту, и будет...

fortran / 19 октября 2011
1 голос
2 ответов

У меня на сайте есть автозаполнение. Я использую Tokeninput . Когда нет результата, у меня есть...

Cyrus / 13 сентября 2011
0 голосов
1 ответ

Я хочу использовать схему, в которой символ пробела вызывается после одного фильтра, и после этого...

monavari-lebrecht / 12 сентября 2011
2 голосов
1 ответ

Я пытаюсь разработать синтаксический анализатор UCI в Objective-C, используя ParseKit, но мне нужен...

Carmine Paolino / 19 августа 2011
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...