Я изучаю НЛП с Керасом и прохожу учебное пособие. Код следующий: import tensorflow_datasets as tfds...
Я хочу получить список похожих слов. Поскольку Spacy не имеет встроенной поддержки для этого, я...
У меня есть фрейм данных, который включает в себя 1604 абзац следующим образом: Я хочу извлечь все...
Я пытаюсь создать векторизатор tf-idf с нуля. Я рассчитал TF и IDF, но у меня возникли проблемы с...
Я пытался различными способами правильно пометить группу слов, которые образуют фразу (особенно...
Я хотел бы преобразовать свои документы в вектор, используя BERT, по одному вектору для каждого...
Проблема возникает между предложением или помеченным корпусом, но я не могу решить код, это код...
Размер набора данных: 81256, Классы: 200, Диапазон для каждого класса варьируется от 2757 для...
Я бы хотел исправить слова с орфографическими ошибками в тексте на французском языке, кажется, что...
Я делаю POS-тегирование на бенгальском языке, но эта ошибка показывает, что когда я пишу print...
Например, предположим, у нас есть два слова: «отлично» и «очень хорошо», которые по контексту...
При проверке сходства между двумя строками с их синонимичными словами это почти даст нам более чем...
Можно ли разделить пользователей на одном экземпляре сервера Brat? Я знаю, как создавать новые...
В настоящее время я работаю в python со spacy, и есть различные предварительно обученные модели,...
Я делаю текстовое суммирование, но при запуске этого блока кода for iteration in range(500):...
У меня есть набор данных nlp, и в соответствии с официальным руководством Pytorch я изменяю набор...
Я хочу запустить textrank для большого корпуса (только мой dev dev использует 17K предложений)...
это мой код with open('file.txt', 'r') as source: # Indentation polTerm = [line
С помощью gensim я могу решить уравнение «король + женщина - мужчина = королева» с помощью этой...
Я делаю pos-тегирование, а алгоритм - алгоритм Баума-Уэлча. Я хочу отправить типы и теги в файл
Я пробираюсь через модели LDA для анализа текста;Я слышал, что реализация Mallet - лучшая. Тем не...
Я скачал код для CoreMLBERT, оптимизированный для ответа на вопрос . Мне нужно масштабировать его...
У меня есть файл .csv, и я хочу разделить неанглийский текст и английский текст в двух разных...
Я попробовал spacy for ner, но результаты весьма непредсказуемы. Иногда spacy не распознает...
Это из упражнения по анализу текста с использованием данных из Гнилых Помидоров. Данные находятся в...