Вопросы с тегом тм

0 голосов

0 ответов

Текстовый анализ данных онлайн новостей в тм показывает разные данные в окончательном выводе

Почему эта ошибка возникает при извлечении текста из новостных онлайн-данных?В Интернете я удалил...

shanmuga priya / 12 декабря 2018

0 голосов

1 ответ

Объединение файлов .txt с символьными данными во фрейм данных для анализа тидитекста

У меня есть куча TXT-файлов с описаниями заданий, и я хочу импортировать их для анализа анализа...

Reuben Sarwal / 06 декабря 2018

0 голосов

0 ответов

R tm content_transformer: медленная пользовательская функция

Я очищаю текстовый корпус около 50 тыс. Элементов, 150 МБ, в основном используя встроенные функции...

Tom Wagstaff / 05 декабря 2018

0 голосов

3 ответов

Извлечение текста из * .txt файлов в R

Я использовал Expressions для Mac, чтобы подтвердить работу Regex, но я не могу найти команду для...

IanLux / 04 декабря 2018

0 голосов

2 ответов

Сделайте udpipe_annotate () быстрее

В настоящее время я работаю над документом Text Mining, где хочу абстрагировать релевантные...

R overflow / 27 ноября 2018

0 голосов

1 ответ

Удалить все знаки препинания из текста, включая апострофы для пакета tm

У меня есть вектор, состоящий из твитов (просто текст сообщения), который я очищаю для целей...

William / 20 ноября 2018

0 голосов

0 ответов

Создать тепловую карту для результатов findAssocs на основе времени

У меня есть следующие данные, для которых я сначала создаю матрицу термина документа, а затем...

ch.elahe / 18 ноября 2018

0 голосов

0 ответов

преобразование тм в тидитекст

Я пытаюсь выучить тидитекст.Я могу следовать примерам на веб-сайте tidytext, если использую пакеты...

dcoffey / 16 ноября 2018

0 голосов

2 ответов

R - Матрица термина документа с разделенными запятыми текстовыми столбцами

У меня есть фрейм данных со столбцом, состоящим из Strings (project_skills), который обозначает...

Tobias Mini / 15 ноября 2018

0 голосов

1 ответ

Попытка удалить специальные символы и неанглийские слова из моих данных R

Я пытаюсь очистить свои данные для удаления; и.) специальные символы (например, + _), ii.)...

Emm / 09 ноября 2018

0 голосов

1 ответ

Создать матрицу сроков документа с N-граммами в R

Я использую пакет "tm" для создания DocumentTermMatrix в R. Он хорошо работает для одного грамма,...

heisenbug47 / 08 ноября 2018

0 голосов

1 ответ

Удалить специальный символ из корпуса

Я построил данные, которые показывают все термины с пунктуацией и их частотой. Затем я должен...

Mrinal Bhatt / 06 ноября 2018

0 голосов

1 ответ

R - вернуть n совпадений через расстояние Левенштейна

Я хотел бы найти n лучших совпадений с данной строкой через расстояние Левенштейна. Я знаю, что...

jvalenti / 03 ноября 2018

0 голосов

2 ответов

Найти частоту терминов из функции

Мне нужно найти частоту терминов из созданной мной функции, которая находит термины с пунктуацией в...

Mrinal Bhatt / 01 ноября 2018

0 голосов

0 ответов

Как сохранить TM VCorpus с пользовательской мета в R

Я сохраняю корпус ТМ в R. writeCorpus(as.character(thecrp), dirdst, filenames = NULL) Все нормально...

aSiteMade4u / 30 октября 2018

0 голосов

1 ответ

R - Как упростить очистку этого текста от специальных символов?

Я подозреваю, что есть способ упростить предварительную обработку этого текста.Однако я не смог...

onodok / 28 октября 2018

0 голосов

2 ответов

Удалить строку специальных символов из R

Попытка запустить tm на R, и я не могу избавиться от â€“ как строки.Я пробовал "â€“,...

Kallikrates / 28 октября 2018

0 голосов

1 ответ

DocumentTermMatrix / LDA выдает ненулевую ошибку ввода, когда нет пустых документов

Я пробую свою первую модель LDA в R и получил ошибку Error in LDA(Corpus_clean_dtm, k, method =...

cyb / 26 октября 2018

0 голосов

1 ответ

R- анализ текста - печать конкретного текста, который содержит биграмму

Анализ текста с R. Мой набор данных - 2000 комментариев от 2000 различных опросов.Я создал...

Robbie / 22 октября 2018

0 голосов

2 ответов

проблемы в stemming в текстовом анализе (шведские данные)

В следующих кодах моя цель - уменьшить количество слов с одинаковым основанием.Например, kompis на...

Annika Magnusson / 17 октября 2018

0 голосов

1 ответ

Основа каждого слова

Я хочу остановить каждое слово.Например, «hardworking employees» следует преобразовать в «hardwork...

john / 07 октября 2018

0 голосов

1 ответ

удаление всех нелатинских символов в R

здесь две строки *3472459 PIVO 何か-何か-何か/100х1,5g *3472459 VINO 何か何か何か100х1,5g Как удалить все...

D.Joe / 06 октября 2018

0 голосов

1 ответ

Доступ к определенным элементам из уникальных слов / терминов в документе

этот код дает вывод в виде матрицы.Но здесь следует избегать повторяющихся слов, таких как is,am, i

9113303 / 05 октября 2018

0 голосов

1 ответ

Какой пакет R я могу использовать для подсчета появления уникальных строк в массиве

Мне нужно посчитать вхождение уникальных слов в серии слов и присвоить значение 1, когда в серии...

Chamil Rathnayake / 03 октября 2018

0 голосов

1 ответ

Выбор списка только слова с латинской буквой R

Скажите, что есть данные text=c(車、,男,犬, sba, druzhba) Как получить список только со словами с...

D.Joe / 03 октября 2018