Я создал DTM. library(tm) corpus = Corpus(VectorSource(dat$Reviews)) dtm =...
Я предварительно обрабатываю свои данные для запуска модели LDA.Мне было интересно, есть ли лучший...
Я работаю с SOTU корпусом quanteda.corpora, и мне нужно настроить его на подмножество, чтобы...
Я пытаюсь применить wordfish к data_corpus_ukmanifestos quanteda.corpora, но, похоже, он никогда не...
У меня есть фрейм данных с 2 текстовыми полями: комментарий и основной пост в основном это...
Рассмотрим этот простой пример bogustib <- tibble(doc_id = c(1,2,3), text = c('bug',...
Мне нужна функция для поиска слов на определенном «расстоянии».Слова «сумка» и «инструмент»...
Я создал приборную панель, используя R-Shiny.Пользователь введет слово, оно будет передано команде...
как учитывать дополнительные переменные Я работаю над задачей классификации, используя квантеду в R...
Я использовал код на этой странице данных https://tutorials.quanteda.io/basic-operations/fcm/fcm/,...
Я работаю с несколькими текстовыми сообщениями, используя пакет quanteda. Мои тексты содержат теги,...
Я делю длинный документ на главы, используя функцию corpus_segment в пакете tm. После запуска...
У меня есть слово, и я хочу вывести в R все возможные отклонения (замена, замена, вставка) для...
Для получения базовых сведений о нескольких сотнях PDF-файлов я хочу рассчитать показатель...
Я пытаюсь найти конкретные слова в корпусе с помощью dfm_lookup (). Я действительно борюсь со...
Я новичок как в начальной загрузке, так и в пакете quanteda для анализа текста. У меня есть большой...
Я надеюсь получить совет относительно выбора двух или более несмежных файлов для формирования...
Я пытаюсь случайным образом отобрать примеры KWIC из довольно большого корпуса.Для небольших...
У меня есть сетевой график, рассчитанный с помощью функции textplot_network() пакета quanteda.Для...
Во время игры с лемматизацией, удалением стоп-слов, переносом слов и т. Д. Для немецкого текста у...
Рассмотрим этот пример tibble(text = c('a grande latte with soy milk', 'black coffee...
Я использую пример из [здесь]: https://tutorials.quanteda.io/machine-learning/topicmodel/...
Я использовал скрытый семантический анализ в пакете text2vec для генерации векторов слов и...
Я пытаюсь удалить одинарные и двойные символьные токены. вот пример: toks <- tokens(c("This...
corpus_subset определяет документы, которые должны быть сохранены, но как насчет указания документов...