Я использую пакет R quanteda (версия 1.4.3, система Windows), чтобы найти почти дословное повторное...
Я пытаюсь преобразовать массив данных в корпус для китайских материалов. Я использовал JiebaR,...
Я пытаюсь преобразовать ряд файлов XML в совокупность документов для анализа текста с...
texttat_keyness в Quanteda используется для сравнения относительной частоты СЛОВ / ЛЕММАС в двух...
Я использую Quanteda для анализа текста Я использую эти команды corp_df2 <- tokens(df$text,...
после установки пакета quanteda и загрузки библиотеки, я по-прежнему продолжаю получать сообщение:...
Я создал корпус из 233 строк и 3 столбцов (Дата, Заголовок, Статья), где последний столбец, Статья ...
пытаясь следовать учебнику quanteda, я сталкиваюсь с проблемами здесь с программой;выполняя...
Построение этого вопроса: Интерпретация dfm_weight (схема = 'проп' ') с группами (quanteda) Если у...
Я пытаюсь извлечь информацию о дате из нескольких текстовых файлов, используя str_extract_all.Если...
Я смотрю на различные варианты взвешивания, используя dfm_weight.Если я выберу schema = 'prop' и...
команда Я знаю, что облака слов действительно ужасны, но иногда вы получаете эти запросы от своего...
У меня есть фрейм данных с около 100k строк, которые содержат текстовые данные. Используя пакет...
Рассмотрим этот забавный пример mytib <- tibble(text = c('i can see clearly now',...
Я пытаюсь настроить словарь quanteda, который содержит много совпадающих терминов. Я полагаю, что...
До использования quanteda для анализа текста я использовал Provalis Wordstat.При использовании...
Я работаю с quanteda (R 3.6.0, Linux, 64-bit) в очень большой текстовой базе данных (> 20 ГБ). Вот...
У меня есть вопрос, касающийся предварительной обработки языка в Quanteda R. Я хочу сгенерировать...
Я хочу передать список аргументов как вектор другой команде в R. Я не хочу повторять один и тот же...
Я хочу быть в состоянии найти сходство между двумя строками, взвешивая каждый токен (слово) по...
Рассмотрим этот простой пример dfm1 <- tibble(text = c('hello world', 'hello...
Скажем, у меня есть текстовые данные, подобные приведенному ниже примеру текста, которые мне нужно...
Рассмотрим этот простой пример. tibble(text = c('a grande latte with soy milk',...
У меня есть текст, который у меня есть OCR'd.OCR поместил много новых строк (\ n), где они не...
Я хочу дать краткое резюме по корпусу PDF-файлов.Я хочу включить столбцы: Текстовые типы Жетоны...