Обеспечивает ли Keras Tokenizer такие функции, как определение границ и лемметизация? Если это так,...
Input:(Google AND Microsoft OR Google Pixel AND NOT Apple IOS) Desired Output:[(Google,AND,Microsoft...
Мой вопрос связан с моим прошлым вопросом: Разделить текст в ячейках и создать дополнительные...
Elasticsearch noob здесь пытается что-то понять У меня есть этот запрос { "size": 10,...
Разница между tokenize.fit_on_text, tokenize.text_to_sequence и word embeddings? Пытался искать на...
Хотелось бы взять список комментариев из фрейма данных, сначала разобрать в список предложений,...
Я работаю с набором данных cnn_dailymail , который является частью набора данных TensorFlow . Моя...
Я хочу создать токенайзер edge_ngram в упругой, но с фильтром. Например, я сохранил текст «30 G». С...
Я хочу вернуть значение строки из таблицы, где другая таблица содержит значение, разделенное...
Я новичок в программировании, и я попытался сделать некоторые интересные вещи и оказался здесь, в...
Я хочу маркировать текст с помощью gensim.utils.tokenize(). И я хочу добавить несколько фраз,...
Я пытаюсь извлечь названия компаний из текста, при создании файла TSV для обучения существующей...
Я хочу сделать это с python и pandas. Предположим, у меня есть следующее: file_id text 1 I am the...
Spacy автоматически токенизирует сокращения слов, такие как "dont" и "not", в "do" и "nt" / "n't"....
Я создал индекс Azure для своей коллекции DocumentDB, и, похоже, он работает нормально. Индекс...
Я пытаюсь проанализировать некоторые данные из обзоров приложений. Я хочу использовать FreqDist...
Предположим, у меня есть такой документ: document = ["This is a document\nwhich has to be...
Я пытаюсь создать Word Embeddings, используя Word2Vec. Мне интересно, каковы плюсы и минусы...
У меня есть исходный код как: model_stateless.fit(x_train, y_train, batch_size=batch_size,...
Я пытаюсь создать приложение, которое делает фотографию математического уравнения, преобразует его...
Я пытаюсь разбить строку на символы, используя boost Текущий токенайзер буста будет...
Попытка удалить стоп-слова из CSV-файла, который имеет 3 столбца и создает новый CSV-файл с...
Я работаю над проектом НЛП и надеюсь на токенизацию предложений и подсчет различных токенов.Иногда...
Я пытаюсь пересоздать простую функцию, которая запрашивает словарь в качестве входных данных
В настоящее время я работаю над программой для получения списка твитов по заданной теме.До тех пор...