Почему эта ошибка возникает при извлечении текста из новостных онлайн-данных?В Интернете я удалил...
У меня есть куча TXT-файлов с описаниями заданий, и я хочу импортировать их для анализа анализа...
Я очищаю текстовый корпус около 50 тыс. Элементов, 150 МБ, в основном используя встроенные функции...
Я использовал Expressions для Mac, чтобы подтвердить работу Regex, но я не могу найти команду для...
В настоящее время я работаю над документом Text Mining, где хочу абстрагировать релевантные...
У меня есть вектор, состоящий из твитов (просто текст сообщения), который я очищаю для целей...
У меня есть следующие данные, для которых я сначала создаю матрицу термина документа, а затем...
Я пытаюсь выучить тидитекст.Я могу следовать примерам на веб-сайте tidytext, если использую пакеты...
У меня есть фрейм данных со столбцом, состоящим из Strings (project_skills), который обозначает...
Я пытаюсь очистить свои данные для удаления; и.) специальные символы (например, + _), ii.)...
Я использую пакет "tm" для создания DocumentTermMatrix в R. Он хорошо работает для одного грамма,...
Я построил данные, которые показывают все термины с пунктуацией и их частотой. Затем я должен...
Я хотел бы найти n лучших совпадений с данной строкой через расстояние Левенштейна. Я знаю, что...
Мне нужно найти частоту терминов из созданной мной функции, которая находит термины с пунктуацией в...
Я сохраняю корпус ТМ в R. writeCorpus(as.character(thecrp), dirdst, filenames = NULL) Все нормально...
Я подозреваю, что есть способ упростить предварительную обработку этого текста.Однако я не смог...
Попытка запустить tm на R, и я не могу избавиться от – как строки.Я пробовал "–,...
Я пробую свою первую модель LDA в R и получил ошибку Error in LDA(Corpus_clean_dtm, k, method =...
Анализ текста с R. Мой набор данных - 2000 комментариев от 2000 различных опросов.Я создал...
В следующих кодах моя цель - уменьшить количество слов с одинаковым основанием.Например, kompis на...
Я хочу остановить каждое слово.Например, «hardworking employees» следует преобразовать в «hardwork...
здесь две строки *3472459 PIVO 何か-何か-何か/100х1,5g *3472459 VINO 何か何か何か100х1,5g Как удалить все...
этот код дает вывод в виде матрицы.Но здесь следует избегать повторяющихся слов, таких как is,am, i
Мне нужно посчитать вхождение уникальных слов в серии слов и присвоить значение 1, когда в серии...
Скажите, что есть данные text=c(車、,男,犬, sba, druzhba) Как получить список только со словами с...