Я пытаюсь подсчитать количество ключевых слов в нескольких файлах PDF. library(tm)...
У меня есть фрейм / таблица данных, куда я импортировал файл простого текста (txt).Текст очень...
У меня есть вектор, состоящий из твитов (просто текст сообщения), который я очищаю для целей...
У меня есть набор данных с ответами пользователей, знают ли они бренд или нет. Некоторые...
Я хочу перевести ( Транслитерация ) абзаца с хинди (любой региональный язык) на английский,...
Я анализирую некоторые бренды в тексте, чтобы узнать, как KPI распознает рекламу. Однако бренды,...
У меня есть вопрос о функции «аугмента» из учебника Силге и Робинсона «Текстовое копирование с...
У меня есть набор данных, в котором много твитов.это твиты на английском, арабском и китайском...
Я пытаюсь очистить свои данные для удаления; и.) специальные символы (например, + _), ii.)...
У меня есть несколько HTML-документов, и некоторые из них содержат много тегов привязки. Этот...
Я новичок в Python и был бы очень благодарен, если бы вы могли помочь мне с моей проблемой...
Мне нужно извлечь текст между двумя выражениями (начало и конец) из текстового файла (начало и...
У меня есть несколько текстовых файлов с таблицей в них. Пример одного файла ниже: File_1:...
Я хочу найти похожие темы в train_dict для данного test_dict. У меня есть два словаря - train_dict...
library(readtext) data_dir <- system.file("E:/project_refrences", package =...
У меня есть набор текстов из разных стран.Я пытаюсь увидеть, как часто в текстах встречается...
Формат данных CSV Общее количество документов 500. Количество полей 10. просмотр данных я...
Я строю систему вопросов и ответов для конкретного домена.Я хотел определить, содержит ли абзац...
В своем тексте новостных статей я хотел бы перевести несколько разных нграмм, относящихся к одной и...
Мне нужно посчитать вхождение уникальных слов в серии слов и присвоить значение 1, когда в серии...
Я получаю эту ошибку «AttributeError: у объекта« Word2Vec »нет атрибута« index2word »» в следующем...
У меня есть 2 таблицы.Таблица1 - это таблица меньшего размера со значениями около 10К.Таблица 1...
Можно ли добавить пользовательские слова в лемматизатор nltk? Я пытаюсь лемматизировать слова из...
У меня есть датафрейм со строками текста.Я хотел бы выделить для каждой строки текста вектор...
Я использую библиотеку python PyPDF2, чтобы обрезать многие PDF-файлы, чтобы вырезать ненужную...