Вопросы с тегом quanteda

1 голос

0 ответов

(решается обновлением) Измерение сходства предложений с предложениями целевого документа (ошибка msg)

Я использую пакет R quanteda (версия 1.4.3, система Windows), чтобы найти почти дословное повторное...

awagner / 11 октября 2019

1 голос

0 ответов

Как избежать слова токен при преобразовании данных в корпус?

Я пытаюсь преобразовать массив данных в корпус для китайских материалов. Я использовал JiebaR,...

Ming MA / 10 октября 2019

1 голос

1 ответ

Как читать XML-файлы, содержащие несколько «документов» в R для анализа текста?

Я пытаюсь преобразовать ряд файлов XML в совокупность документов для анализа текста с...

Henry Overos / 09 октября 2019

2 голосов

1 ответ

texttat_keyness для POS, а не слов

texttat_keyness в Quanteda используется для сравнения относительной частоты СЛОВ / ЛЕММАС в двух...

dfayers / 07 октября 2019

1 голос

0 ответов

Аргумент нграммы не используются

Я использую Quanteda для анализа текста Я использую эти команды corp_df2 <- tokens(df$text,...

Nathalie / 07 октября 2019

0 голосов

0 ответов

Ошибка: не удалось найти функцию "texttat_frequency"

после установки пакета quanteda и загрузки библиотеки, я по-прежнему продолжаю получать сообщение:...

feszterle / 06 октября 2019

1 голос

0 ответов

Как объединить несколько слов в DFM?

Я создал корпус из 233 строк и 3 столбцов (Дата, Заголовок, Статья), где последний столбец, Статья ...

Arma_91 / 22 сентября 2019

0 голосов

1 ответ

Пакет RStudio "digest" нельзя использовать, загружать или устанавливать

пытаясь следовать учебнику quanteda, я сталкиваюсь с проблемами здесь с программой;выполняя...

Ivo B. / 19 сентября 2019

0 голосов

1 ответ

Понимание того, как работает dfm_groups без добавления группы

Построение этого вопроса: Интерпретация dfm_weight (схема = 'проп' ') с группами (quanteda) Если у...

Ted Mosby / 09 июля 2019

0 голосов

1 ответ

Ошибка «подписи вне границ» в str_extract_all

Я пытаюсь извлечь информацию о дате из нескольких текстовых файлов, используя str_extract_all.Если...

James G Wilson / 09 июля 2019

1 голос

1 ответ

Интерпретация dfm_weight (схема = 'проп') с группами (квантеда)

Я смотрю на различные варианты взвешивания, используя dfm_weight.Если я выберу schema = 'prop' и...

Ted Mosby / 02 июля 2019

0 голосов

0 ответов

Сохранение Wordcloud в Quanteda не работает

команда Я знаю, что облака слов действительно ужасны, но иногда вы получаете эти запросы от своего...

Joerg Koch / 02 июля 2019

2 голосов

1 ответ

Извлекайте лучшие положительные и отрицательные черты при применении словаря в Quanteda

У меня есть фрейм данных с около 100k строк, которые содержат текстовые данные. Используя пакет...

trotta / 24 июня 2019

1 голос

2 ответов

Как сложить столбцы взвешенного DFM в квантовой?

Рассмотрим этот забавный пример mytib <- tibble(text = c('i can see clearly now',...

ℕʘʘḆḽḘ / 13 июня 2019

0 голосов

1 ответ

Смотри вперед и смотри назад не работает для Quanteda словарь

Я пытаюсь настроить словарь quanteda, который содержит много совпадающих терминов. Я полагаю, что...

Rafael / 12 июня 2019

1 голос

0 ответов

Словарь в квантовой системе с логическими / контекстными правилами (см. «Правила близости» Wordstat)

До использования quanteda для анализа текста я использовал Provalis Wordstat.При использовании...

Rafael / 12 июня 2019

0 голосов

0 ответов

Сбой dfm () на очень большом объекте токенов после того, как NA введены целочисленным принуждением

Я работаю с quanteda (R 3.6.0, Linux, 64-bit) в очень большой текстовой базе данных (> 20 ГБ). Вот...

kdhyde / 05 июня 2019

0 голосов

1 ответ

Quanteda R: Как удалить цифры или символы "из" / "в" токене?

У меня есть вопрос, касающийся предварительной обработки языка в Quanteda R. Я хочу сгенерировать...

Hu_Ca / 03 июня 2019

0 голосов

1 ответ

Передача нескольких аргументов в виде списка в R

Я хочу передать список аргументов как вектор другой команде в R. Я не хочу повторять один и тот же...

ambrish dhaka / 02 июня 2019

0 голосов

3 ответов

R: взвешенное сходство частоты (tfidf) обратной строки документа между строками

Я хочу быть в состоянии найти сходство между двумя строками, взвешивая каждый токен (слово) по...

Miguel Vazq / 29 мая 2019

0 голосов

1 ответ

Как сделать сложение / вычитание матричных элементов документа в quanteda?

Рассмотрим этот простой пример dfm1 <- tibble(text = c('hello world', 'hello...

ℕʘʘḆḽḘ / 19 мая 2019

0 голосов

1 ответ

Как построить словарь, используя {quanteda} с различными прилагательными, связанными с одним существительным?

Скажем, у меня есть текстовые данные, подобные приведенному ниже примеру текста, которые мне нужно...

Fabian Habersack / 10 мая 2019

1 голос

1 ответ

Как рассчитать соотношение слов по дням в квантеде?

Рассмотрим этот простой пример. tibble(text = c('a grande latte with soy milk',...

ℕʘʘḆḽḘ / 09 мая 2019

0 голосов

1 ответ

Замена символа на \ n в регулярном выражении, а затем превращение текста в корпус Кванта

У меня есть текст, который у меня есть OCR'd.OCR поместил много новых строк (\ n), где они не...

michael joseph / 07 мая 2019

1 голос

1 ответ

Показать сводку по конкретным документам

Я хочу дать краткое резюме по корпусу PDF-файлов.Я хочу включить столбцы: Текстовые типы Жетоны...

BanffBoss122 / 04 мая 2019