Вопросы с тегом quanteda

2 голосов

1 ответ

Удалить слова из DTM

Я создал DTM. library(tm) corpus = Corpus(VectorSource(dat$Reviews)) dtm =...

Banjo / 24 апреля 2019

0 голосов

1 ответ

Есть ли лучший способ игнорировать множественное число, чем "stem = TRUE" в dfm?

Я предварительно обрабатываю свои данные для запуска модели LDA.Мне было интересно, есть ли лучший...

Arma_91 / 20 апреля 2019

0 голосов

0 ответов

Как мне назначить мой SOTU dfm для президентов Уилсона, а затем в Quanteda?

Я работаю с SOTU корпусом quanteda.corpora, и мне нужно настроить его на подмножество, чтобы...

nlplearner / 16 апреля 2019

0 голосов

1 ответ

Почему qumoteda textmodel_wordfish работает бесконечно, когда я обращаюсь к корпусу британских партийных манифестов quanteda.corpora?

Я пытаюсь применить wordfish к data_corpus_ukmanifestos quanteda.corpora, но, похоже, он никогда не...

datanovice / 12 апреля 2019

1 голос

1 ответ

quanteda: вычисление сходства текста по строкам между двумя DFM

У меня есть фрейм данных с 2 текстовыми полями: комментарий и основной пост в основном это...

Carbo / 11 апреля 2019

1 голос

1 ответ

как накормить тибле спасир?

Рассмотрим этот простой пример bogustib <- tibble(doc_id = c(1,2,3), text = c('bug',...

ℕʘʘḆḽḘ / 04 апреля 2019

1 голос

1 ответ

Существует ли функция R для поиска ключевых слов в пределах определенного «расстояния до слова»?

Мне нужна функция для поиска слов на определенном «расстоянии».Слова «сумка» и «инструмент»...

Willem Gooijaers / 04 апреля 2019

0 голосов

2 ответов

Команда KWIC выдает ошибку: объект 'docname' не найден

Я создал приборную панель, используя R-Shiny.Пользователь введет слово, оно будет передано команде...

Ankit songara / 03 апреля 2019

0 голосов

1 ответ

Анализ текста в R: Как добавить переменные в мой классификатор машинного обучения в дополнение к токенам?

как учитывать дополнительные переменные Я работаю над задачей классификации, используя квантеду в R...

Carbo / 01 апреля 2019

0 голосов

1 ответ

получение семантической сети на основе матрицы совместного использования признаков (fcm) Quanteda

Я использовал код на этой странице данных https://tutorials.quanteda.io/basic-operations/fcm/fcm/,...

bgreen / 31 марта 2019

1 голос

1 ответ

R: квантеда удаление тегов из корпуса

Я работаю с несколькими текстовыми сообщениями, используя пакет quanteda. Мои тексты содержат теги,...

Wangana / 30 марта 2019

0 голосов

1 ответ

Как удалить текст из корпуса в R?

Я делю длинный документ на главы, используя функцию corpus_segment в пакете tm. После запуска...

Erlend Tangeraas Lygre / 28 марта 2019

1 голос

1 ответ

Как вывести в R все возможные отклонения слова для фиксированного значения расстояния?

У меня есть слово, и я хочу вывести в R все возможные отклонения (замена, замена, вставка) для...

De De / 26 марта 2019

0 голосов

1 ответ

Как получить базовую статистику читабельности с помощью Quanteda в R

Для получения базовых сведений о нескольких сотнях PDF-файлов я хочу рассчитать показатель...

Bammers / 21 марта 2019

1 голос

1 ответ

Создать пользовательский словарь из вектора символов

Я пытаюсь найти конкретные слова в корпусе с помощью dfm_lookup (). Я действительно борюсь со...

BanffBoss122 / 18 марта 2019

2 голосов

1 ответ

Как я могу загрузить статистику читабельности текста с помощью Quanteda?

Я новичок как в начальной загрузке, так и в пакете quanteda для анализа текста. У меня есть большой...

beddotcom / 14 марта 2019

1 голос

1 ответ

Выбор двух несмежных файлов для формирования подмножества в Quanteda

Я надеюсь получить совет относительно выбора двух или более несмежных файлов для формирования...

bgreen / 08 марта 2019

0 голосов

1 ответ

Примеры случайных выборок KWIC в Quanteda

Я пытаюсь случайным образом отобрать примеры KWIC из довольно большого корпуса.Для небольших...

Dan Walters / 28 февраля 2019

0 голосов

1 ответ

quanteda: подсчитать количество ребер для каждого узла в сетевом графике

У меня есть сетевой график, рассчитанный с помощью функции textplot_network() пакета quanteda.Для...

contefranz / 22 февраля 2019

0 голосов

0 ответов

tokens_replace () работает только с stri_trans_general (), а не с Encoding ()

Во время игры с лемматизацией, удалением стоп-слов, переносом слов и т. Д. Для немецкого текста у...

LeaK / 20 февраля 2019

0 голосов

2 ответов

как использовать квантиду на агрегированных данных?

Рассмотрим этот пример tibble(text = c('a grande latte with soy milk', 'black coffee...

ℕʘʘḆḽḘ / 15 февраля 2019

0 голосов

1 ответ

Преобразовать кадр данных в корпус

Я использую пример из [здесь]: https://tutorials.quanteda.io/machine-learning/topicmodel/...

Elr Mant / 13 февраля 2019

0 голосов

1 ответ

Почему LSA в text2vec каждый раз дает разные результаты?

Я использовал скрытый семантический анализ в пакете text2vec для генерации векторов слов и...

user3554004 / 13 февраля 2019

0 голосов

3 ответов

Как удалить одинарные и двойные символьные токены с помощью quanteda :: tokens_select ()

Я пытаюсь удалить одинарные и двойные символьные токены. вот пример: toks <- tokens(c("This...

ronencozen / 09 февраля 2019

0 голосов

1 ответ

Сбросить документы из корпуса в Quanteda, если выполнены два условия

corpus_subset определяет документы, которые должны быть сохранены, но как насчет указания документов...

NDG / 08 февраля 2019