Когда я вставляю содержимое некоторого скрипта Python в текстовый виджет, содержимое может быть...
Я пишу грамматику с большим количеством нечувствительных к регистру ключевых слов в ANTLR4.Я собрал...
Я только начал использовать Solr, и я не уверен, что мне не хватает.У меня 2 поля ул. Адреса и...
Существует ли прямой эффективный способ преобразования std::sub_match в std::basic_string_view (без...
Я работаю с текстом в utf-8 .Я хочу токенизировать его, а затем преобразовать в список.Однако я...
import re string = re.sub(r'-\n', '', string) Я хочу токенизировать слова текста
Учитывая текст (T) и словарь (D) , как я могу найти все слова, встречающиеся в тексте? A1. Можно...
Мне нужно вычислить матрицу tfidf для нескольких предложений.предложение включает в себя как цифры,...
Я пытался заставить эту программу работать в течение 3 дней.Я также исследовал различные веб-сайты...
Я не хочу использовать сканер, чтобы попросить ввести несколько слов, и я ожидаю разделитель ",",...
У меня есть строка с миллионами слов, и я хотел бы иметь регулярное выражение, которое может...
Я пытаюсь написать метод для токенизации строки в соответствующие слова в массив.Я уже тестировал...
Я делаю некоторый анализ неструктурированных данных в записных книжках - что составляет столбец...
Я пытаюсь построить строку выражения, оцененную с помощью DDMathParser из пользовательского ввода...
Итак, у меня есть переменная buff, которая получает свое значение от функции read (), и я хочу...
У меня есть требование маркировать слова в предложении на основе конкретного списка слов. wordlist...
Я новичок в машинном обучении, и я видел этот метод в учебнике некоторое время назад, но больше не...
Есть ли что-то эквивалентное «неязыковому» или «необработанному» в списке естественных языков...
Прежде всего, я новичок в python / nltk, поэтому приношу свои извинения, если вопрос слишком...
У меня есть этот текстовый файл, который содержит список слов и набор оценок, связанных с каждым из...
sregex_token_iterator почти идеально работает в качестве токенизатора, если для индекса подматрицы...
Если у меня есть файл с некоторой структурой к нему: type 2 0 0 name 100 100 name 1 1 2 name name...
У меня такое ощущение, что есть очевидное решение, но я не могу об этом думать.Используя XSLT 2.0,...
У меня есть три строки, которые являются объединением трех компонентов: одно слово из списка 1...
Я пытаюсь извлечь из документа только строчные буквенно-цифровые символы с помощью: String delim =...