Я хотел бы прочитать файл и сохранить слова в каждой строке в виде списка.Это мой код: main :-...
Я смотрел учебник по использованию утилит Unix, который парень использовал на MAC. У меня был...
Мне было интересно, есть ли в Java способ токенизации строки пробелами, НО, если между апострофами...
Я хочу преобразовать что-то вроде 233 + 4 * (4-8) + 5 в [233, +, 4, *, (, 4, -, 8,), +, 5] Где...
У меня есть строка, которая выглядит так: foo $RESULT :(0.2374742, 0.267722, ...up to a million...
Пока что мое развертывание solr для набора арабских данных у меня работает отлично.Стеблирование и...
Я разрабатываю язык, на котором хочу использовать .. для определения целочисленного диапазона....
можете ли вы помочь мне с этим .. я пытаюсь добиться того, чтобы, когда пользователь вводит свое...
Мне нужен токенайзер, который при наличии строки с произвольным пробелом среди слов создаст массив...
Привет я использую библиотеку ASPTokenInput найти снизу URL https://github
Я пытаюсь токенизировать данные из файла c, содержащего случайные дни и числа. Например, данные:...
Я хотел бы разбить строку на токены, используя Boost.Tokenize. Требуется, чтобы текст в кавычках...
Я пытаюсь токенизировать дамп базы данных, разделенный запятыми.Мне нужно только прочитать первое...
Я хочу вернуть функцию PHP token_get_all () как JSON. Я также хочу, чтобы token_get_all передавал...
У меня есть строка с несколькими пробелами, но когда я использую токенизатор, он разбивает ее на...
Мои данные уже токенизированы с внешним ресурсом, и я хотел бы использовать эти данные в lucene....
Мне нужно разобрать C-подобные скрипты (на самом деле Groovy) на несколько частей, используя "(",...
У меня есть текстовые файлы, использующие кодировку utf-8 и содержащие такие символы, как 'ö', 'ü'...
Я использую NGramFilterFactory для индексации и запросов. Так что, если я ищу "переполнение", он...
Я пытаюсь создать программу на C ++, которая позволяет мне читать из файла и находить совпадения...
Здравствуйте, я анализирую текст и использую strtok () для этого.Я не уверен, как включить '\' в...
BufferedReader br = new BufferedReader(new FileReader("data/Catalog.txt")); String...
Работая с индексом Lucene, у меня есть стандартный формат документа, который выглядит примерно так:...
Например, селектор типа . t { margin: 0 0.5em 1em-0.2em; } сжимается до .t{margin:0 .5em 1em -0
Я хочу сделать немного базового иврита stemming. Все примеры пользовательских анализаторов, которые...