Вопросы с тегом nlp

0 голосов

1 ответ

Простая плотная модель keras замерзает при примерке

Я изучаю НЛП с Керасом и прохожу учебное пособие. Код следующий: import tensorflow_datasets as tfds...

user8270077 / 05 ноября 2019

0 голосов

1 ответ

Есть ли способ загрузить простую обученную модель в gensim?

Я хочу получить список похожих слов. Поскольку Spacy не имеет встроенной поддержки для этого, я...

Foshiba / 05 ноября 2019

0 голосов

0 ответов

Как я могу извлечь предложения из фрейма данных в Python и сохранить ключ абзаца?

У меня есть фрейм данных, который включает в себя 1604 абзац следующим образом: Я хочу извлечь все...

user11345941 / 05 ноября 2019

0 голосов

1 ответ

Создание векторизатора TF-IDF с нуля

Я пытаюсь создать векторизатор tf-idf с нуля. Я рассчитал TF и IDF, но у меня возникли проблемы с...

Deven Bothra / 05 ноября 2019

0 голосов

1 ответ

Есть ли способ правильно пометить (PoS Tagging) слова, которые образуют фразу вместе?

Я пытался различными способами правильно пометить группу слов, которые образуют фразу (особенно...

16180 / 04 ноября 2019

0 голосов

0 ответов

Можно ли векторизовать документы с помощью Google BERT?

Я хотел бы преобразовать свои документы в вектор, используя BERT, по одному вектору для каждого...

user_5 / 04 ноября 2019

0 голосов

0 ответов

для предложения в taggedOutput: TypeError: объект 'NoneType' не повторяется

Проблема возникает между предложением или помеченным корпусом, но я не могу решить код, это код...

Pritom7026 / 04 ноября 2019

0 голосов

1 ответ

Как бороться с крайне несбалансированным набором данных о проблемах (текст)?

Размер набора данных: 81256, Классы: 200, Диапазон для каждого класса варьируется от 2757 для...

Aditya Jyoti / 04 ноября 2019

0 голосов

1 ответ

Использование textblob или spacy для исправления орфографии на французском языке

Я бы хотел исправить слова с орфографическими ошибками в тексте на французском языке, кажется, что...

Kaïna / 04 ноября 2019

0 голосов

1 ответ

для слова, тег в перечислении (предложении): TypeError: объект 'int' не повторяется

Я делаю POS-тегирование на бенгальском языке, но эта ошибка показывает, что когда я пишу print...

Pritom7026 / 04 ноября 2019

0 голосов

1 ответ

Как мы можем найти контекстуальное сходство между двумя разными n-граммами, используя python?

Например, предположим, у нас есть два слова: «отлично» и «очень хорошо», которые по контексту...

Samar Srivastava / 04 ноября 2019

0 голосов

0 ответов

Есть ли способ сравнить 2 абзаца с их наиболее синонимичными словами из wordnet?

При проверке сходства между двумя строками с их синонимичными словами это почти даст нам более чем...

R.Wedisa / 04 ноября 2019

0 голосов

1 ответ

Создать для каждого пользователя рабочее пространство в инструменте аннотации nlplab Brat

Можно ли разделить пользователей на одном экземпляре сервера Brat? Я знаю, как создавать новые...

Ondrej Sotolar / 04 ноября 2019

0 голосов

1 ответ

Разница между контекстно-зависимыми тензорами и векторами слов

В настоящее время я работаю в python со spacy, и есть различные предварительно обученные модели,...

3razOr1993 / 04 ноября 2019

0 голосов

0 ответов

InvalidArgumentError: Тензор embedding_1_input: 0, указанный в feed_devices или fetch_devices, не был найден в графике

Я делаю текстовое суммирование, но при запуске этого блока кода for iteration in range(500):...

Chaine / 04 ноября 2019

0 голосов

1 ответ

Pytorch BiLSTM POS Tagging Проблема: RuntimeError: input.size (-1) должен быть равен input_size. Ожидаемый 6, получил 12

У меня есть набор данных nlp, и в соответствии с официальным руководством Pytorch я изменяю набор...

pandalai / 04 ноября 2019

0 голосов

1 ответ

скудная разреженная матрица: индекс вне диапазона

Я хочу запустить textrank для большого корпуса (только мой dev dev использует 17K предложений)...

Jake / 04 ноября 2019

0 голосов

4 ответов

как разбить строку в readlines и сохранить их в другом списке?

это мой код with open('file.txt', 'r') as source: # Indentation polTerm = [line

prasetya223 / 04 ноября 2019

1 голос

0 ответов

Как я могу использовать ключевые векторы gensim, чтобы найти соединяющие слова между двумя заданными словами?

С помощью gensim я могу решить уравнение «король + женщина - мужчина = королева» с помощью этой...

joe / 04 ноября 2019

0 голосов

1 ответ

Ошибка типа: можно только объединить список (не "str")

Я делаю pos-тегирование, а алгоритм - алгоритм Баума-Уэлча. Я хочу отправить типы и теги в файл

Pritom7026 / 03 ноября 2019

1 голос

0 ответов

Почему Маллет LDA дает плохие результаты, тогда как версия Gensim не дает?

Я пробираюсь через модели LDA для анализа текста;Я слышал, что реализация Mallet - лучшая. Тем не...

Lodore66 / 03 ноября 2019

0 голосов

0 ответов

Сегментирование текста для ответов на вопросы CoreMLBERT учитывает только первый раздел текста

Я скачал код для CoreMLBERT, оптимизированный для ответа на вопрос . Мне нужно масштабировать его...

Mohammed Balfakeih / 03 ноября 2019

0 голосов

1 ответ

Отделение английского текста и неанглийского текста из файла

У меня есть файл .csv, и я хочу разделить неанглийский текст и английский текст в двух разных...

Scholar / 03 ноября 2019

0 голосов

2 ответов

Почему результаты не очень непредсказуемы?

Я попробовал spacy for ner, но результаты весьма непредсказуемы. Иногда spacy не распознает...

BALA / 03 ноября 2019

0 голосов

1 ответ

Наивный Байес, Анализ текста, SKLearn

Это из упражнения по анализу текста с использованием данных из Гнилых Помидоров. Данные находятся в...

Vicki B / 03 ноября 2019