Я могу токенизировать часть строки, но не всю строку. Мне нужна помощь в написании регулярного...
Я хочу прочитать текст и разбить его на предложения, используя NLTK sent_tokenize.Как это сделать?Я...
Предполагается, что эта программа принимает пользовательский ввод с кодом города, выполняет поиск в...
читая ссылку ниже, я ищу пример использования / пример, в котором будет лучше использовать...
Источник кода from nltk.tokenize import MWETokenizer tokenizer = MWETokenizer([('a',...
Я хотел бы маркировать список строк в соответствии с моим самоопределенным словарем. Список строк...
Я использую Spacy для токенизации предложений, и я знаю, что текст, который я передаю токенизатору,...
Я в настоящее время индексирую свои текстовые значения в документе с помощью TextField, например,...
Я заметил некоторый вопрос, касающийся того, как «отсоединить», но пока я не смог найти что-то,...
Ниже приведен код, указанный в ответе на вопрос ; import spacy from spacy.tokenizer import...
Добрый день, У меня есть функция, которая должна иметь возможность опускать и маркировать текст и...
Я новичок в Elastic Search в ASP.NET, и у меня есть проблема, которую я до сих пор не могу решить....
Я пытаюсь правильно разделить слова, чтобы соответствовать моему корпусу. Для этого я уже нашел...
У меня есть несколько CSV-файлов, которые были созданы с помощью токенизации кода. Эти файлы...
import java.io.*; import java.util.*; class A { public static void main(String args[]) throws...
Этот вопрос является продолжением этого вопроса . Вот код: #include <stdio.h> #include...
Как мне написать код такой, чтобы if(token is a operand) do this if(token is a operator) do this...
При каких обстоятельствах утилита командной строки Unix 'wc' и переменная len (text.split ()) в...
Я пишу программу на c, которая читает текст из текстового файла, затем случайным образом выбирает...
Мы хотели бы добавить поддержку филиппинского, лаосского, малазийского и вьетнамского языков в наш...
URL-адрес имеет вид PROTOCOL://HOST:PORT?PARAM1=VALUE1&PARAM2=VALUE2&...PARAMN=VALUEN Я...
Насколько я понимаю после прочтения документов, работает эластичный поиск в том, что он учитывает...
Я новичок в Word2Vec и пытаюсь группировать слова по их сходству.Для начала я использую nltk для...
Я пишу лексер для Markdown.В процессе я понял, что не до конца понимаю, какова должна быть его...
У меня есть датафрейм с текстовыми столбцами.Я разделил их на x_train и x_test. . Мой вопрос: лучше...