При переходе на новую версию Gate (с 8.4.1 до 8.5.1), кажется, невозможно изменить газету ANNIE,...
Как с помощью spaCy 2.x извлечь словосочетания на основе частей речи?Я хочу использовать шаблоны с...
У меня есть массив (страховых) договоров (в формате .docx), обработку которых я пытаюсь...
Я сталкиваюсь с трудностями при использовании слоя встраивания Keras с одним горячим кодированием...
Я изучаю очистку текста с помощью Python онлайн.Я избавился от некоторых стоп-слов и опустил букву....
Я использую MWETokenizer от NLTK, чтобы получить многословную пометку.Вот мой пример кода: import...
Я новичок в Python и сталкиваюсь с проектом НЛП. Это мой код: doc1 = "I am a dog and I like...
Я новичок в Python, и у меня есть набор данных, который выглядит следующим образом Я извлекаю...
У меня есть набор ключевых слов, по которым я уже соответствую.Это медицинский контекст, поэтому я...
Например, из lens = [3, 5, 4] мы хотим получить mask = [[1, 1, 1, 0, 0], [1, 1, 1, 1, 1], [1, 1, 1,...
У меня есть фрейм / таблица данных, куда я импортировал файл простого текста (txt).Текст очень...
Я хочу извлечь определенную часть письма из текстового файла с помощью Python.Начало и окончание...
У меня есть 9000 образцов без меток, я хочу, чтобы это был бинарный класс (0 и 1) Кроме того, у...
У меня есть модель на основе doc2vec, обученная на нескольких документах. Я хотел бы использовать...
Я использую предварительно обученные статистические модели Spacy, такие как en_core_web_md.Я...
Мой формат данных: datas = {[1,2,4,6,7],[2,3],[5,6,8,3,5],[2],[93,23,4,5,11,3,5,2],...} Каждый...
На каждом крошечном этапе процесса обучения doc2vec требуется слово и его соседи в пределах...
У меня есть программа, которая выполняет сравнение текстов, используя косинусное сходство
Существует ли алгоритм, который может автоматически рассчитывать числовую оценку степени...
Я недавно начал работать с UIMA RUTA. У меня есть несколько вопросов. 1: Как мы можем использовать...
У меня есть следующие данные, для которых я сначала создаю матрицу термина документа, а затем...
У меня есть RDF / Turtle Resource, как показано ниже: @prefix factory: <http://linkedfactory.iwu
У меня есть 27000 свободных текстовых элементов, каждое из примерно 2-3 предложений. Мне нужно...
Я создаю свое приложение js для первого узла, чтобы получать твиты из Twitter и применять к ним...
Я знаю, что могу использовать что-то вроде этого theText='She loves music. Her favorit...