Цель: Предсказать связанные оценки IMDB на основе настроений в обзоре (оценки 1-10, а не только + и...
Я пытаюсь создать простую модель для предсказания следующего слова в предложении. У меня есть...
Я новичок в nlp и spaCy , и я работаю над проектом по извлечению имен людей и компаний из визитных...
Я не понимаю, что такое языковая модель. Я делаю классификацию текста на диалекте. И я продолжаю...
я использовал pytesseract для идентификации текста с картинки pytesseract.pytesseract.tesseract_cmd...
Это выглядит хорошо для string, но это не работает для меня для word. Я работаю с поиском в...
Я должен добавить слой пула k-max в модели CNN, чтобы обнаружить поддельные обзоры. Пожалуйста,...
В последнее время я работаю над проектом интеллектуального анализа текста.Моя цель - объединить...
Я работаю над набором жалоб клиентов авиакомпаний. Поскольку это «жалобы», общий консенсус - это...
Начиная с версии 2.1, у spaCy есть языковая модель в стиле BERT (LM). Он предсказывает слова-слова...
Я хочу маркировать текст с помощью gensim.utils.tokenize(). И я хочу добавить несколько фраз,...
Это мой код, который я пытаюсь обучить, чтобы получить предварительно обученную модель для...
Я пытаюсь импортировать pyLDAvis, но выдает ошибку ModuleNotFoundError: Нет модуля с именем...
Spacy автоматически токенизирует сокращения слов, такие как "dont" и "not", в "do" и "nt" / "n't"....
Я хочу извлечь особенности из предварительно обученного встраивания Перчатки. Но я получил Keyerror...
Справочная информация: Я хочу использовать регулярные выражения для поиска по ключевому слову. Тем...
Я пытаюсь проанализировать некоторые данные из обзоров приложений. Я хочу использовать FreqDist...
Я делаю следующее: re.sub(r'[^ \nA-Za-z0-9/]+', '', document) для удаления...
Из этого поста я узнал, как удалить из текста все, кроме пробелов и буквенно-цифровых символов:...
Я пытаюсь построить алгоритм упрощения предложений на основе Stanford CoreNLP. Одно из упрощений,...
Я хочу работать с GloVe встраиванием в английские предложения.Во время обучения показывается ошибка...
Предположим, у меня есть такой документ: document = ["This is a document\nwhich has to be...
Из-за некоторых технических проблем все пробелы во всех предложениях удалены. (кроме полных...
Я хочу создать приложение для определения языка, которое идентифицирует язык (и) документов. Помимо...
Я использую функцию HashingVectorizer из sklearn.feature_extraction.text, но я не понимаю, как она...