Вопросы с тегом nlp

0 голосов

0 ответов

Использование LogReg для прогнозирования полиномиальных (сентиментальных) оценок IMDB с использованием помеченных данных

Цель: Предсказать связанные оценки IMDB на основе настроений в обзоре (оценки 1-10, а не только + и...

Oaknut / 25 мая 2019

0 голосов

2 ответов

Как ускорить этот алгоритм поиска кортежей слов?

Я пытаюсь создать простую модель для предсказания следующего слова в предложении. У меня есть...

ihatepointers / 25 мая 2019

1 голос

1 ответ

Как обучить модель spaCy с номером строки в качестве функции?

Я новичок в nlp и spaCy , и я работаю над проектом по извлечению имен людей и компаний из визитных...

givo / 25 мая 2019

0 голосов

0 ответов

Является ли языковая модель такой же, как наивный байесовский классификатор?

Я не понимаю, что такое языковая модель. Я делаю классификацию текста на диалекте. И я продолжаю...

John Sall / 25 мая 2019

0 голосов

1 ответ

определить чистый текст из изображения питона

я использовал pytesseract для идентификации текста с картинки pytesseract.pytesseract.tesseract_cmd...

Kaveesha Chethiyawardena / 25 мая 2019

0 голосов

1 ответ

Как определить доминирующий язык текстового слова?

Это выглядит хорошо для string, но это не работает для меня для word. Я работаю с поиском в...

Nazmul Hasan / 25 мая 2019

2 голосов

1 ответ

Что такое K Max Pooling? Как это реализовать в Керасе?

Я должен добавить слой пула k-max в модели CNN, чтобы обнаружить поддельные обзоры. Пожалуйста,...

Avik Nayak / 25 мая 2019

0 голосов

0 ответов

Сходство LDA и Word2vec с кластерными словами

В последнее время я работаю над проектом интеллектуального анализа текста.Моя цель - объединить...

Yuan Shi / 24 мая 2019

0 голосов

1 ответ

Оценка негативности для предложений

Я работаю над набором жалоб клиентов авиакомпаний. Поскольку это «жалобы», общий консенсус - это...

vikky / 24 мая 2019

0 голосов

1 ответ

Access spaCy Маскированная языковая модель

Начиная с версии 2.1, у spaCy есть языковая модель в стиле BERT (LM). Он предсказывает слова-слова...

Sam H. / 24 мая 2019

0 голосов

1 ответ

Как указать дополнительные токены для токенизатора?

Я хочу маркировать текст с помощью gensim.utils.tokenize(). И я хочу добавить несколько фраз,...

DmytroSytro / 24 мая 2019

0 голосов

0 ответов

Сценарий Python для извлечения именованных объектов с фреймворком, застрявшим во время обучения

Это мой код, который я пытаюсь обучить, чтобы получить предварительно обученную модель для...

Houssem Bzi / 24 мая 2019

1 голос

1 ответ

невозможно импортировать pyLDAvis - ModuleNotFoundError: нет модуля с именем _contextvars

Я пытаюсь импортировать pyLDAvis, но выдает ошибку ModuleNotFoundError: Нет модуля с именем...

Arda Gezdur / 24 мая 2019

1 голос

1 ответ

Есть ли способ отключить определенные встроенные правила токенизации в Spacy?

Spacy автоматически токенизирует сокращения слов, такие как "dont" и "not", в "do" и "nt" / "n't"....

Chun Yat / 24 мая 2019

0 голосов

1 ответ

Как обрабатывать невидимые слова для предварительно обученного встраивания слов в Glove, чтобы избежать ключевого ошибки?

Я хочу извлечь особенности из предварительно обученного встраивания Перчатки. Но я получил Keyerror...

reshadshuvo123 / 24 мая 2019

0 голосов

1 ответ

Создавайте синонимы и используйте регулярные выражения, чтобы найти ключевое слово

Справочная информация: Я хочу использовать регулярные выражения для поиска по ключевому слову. Тем...

EER / 23 мая 2019

1 голос

1 ответ

FreqDist для наиболее распространенных слов или фраз

Я пытаюсь проанализировать некоторые данные из обзоров приложений. Я хочу использовать FreqDist...

IngridX / 23 мая 2019

3 голосов

2 ответов

Удалить специальные символы, но не буквы с акцентом

Я делаю следующее: re.sub(r'[^ \nA-Za-z0-9/]+', '', document) для удаления...

Poete Maudit / 23 мая 2019

2 голосов

2 ответов

Удалите все специальные символы из текста, кроме "\ n" и "/"

Из этого поста я узнал, как удалить из текста все, кроме пробелов и буквенно-цифровых символов:...

Poete Maudit / 23 мая 2019

0 голосов

1 ответ

Стэнфордский CoreNLP найти однородные части предложения

Я пытаюсь построить алгоритм упрощения предложений на основе Stanford CoreNLP. Одно из упрощений,...

Danila Zharenkov / 23 мая 2019

0 голосов

0 ответов

java.lang.RuntimeException: java.lang.UnsupportedOperationExceptionat ошибка при обучении GloVe с DL4j

Я хочу работать с GloVe встраиванием в английские предложения.Во время обучения показывается ошибка...

AdithyaYelloju / 23 мая 2019

1 голос

4 ответов

Разделить текст на основе нескольких разделителей ('\ n', '/')

Предположим, у меня есть такой документ: document = ["This is a document\nwhich has to be...

Poete Maudit / 23 мая 2019

0 голосов

1 ответ

Генерация допустимых слов из строки

Из-за некоторых технических проблем все пробелы во всех предложениях удалены. (кроме полных...

shantanuo / 23 мая 2019

1 голос

0 ответов

Многоязычный корпус для набора данных обучения

Я хочу создать приложение для определения языка, которое идентифицирует язык (и) документов. Помимо...

Poete Maudit / 23 мая 2019

2 голосов

0 ответов

Не понимаю HashingVectorizer от sklearn

Я использую функцию HashingVectorizer из sklearn.feature_extraction.text, но я не понимаю, как она...

Toni Garcia / 23 мая 2019