Добавьте метаданные в корпус VectorSource с помощью библиотеки 'tm' в R - PullRequest
0 голосов
/ 20 сентября 2019

У меня есть CSV-файл, и я пытаюсь преобразовать его в корпус, чтобы позже использовать tm_map и применить некоторую кластеризацию.

Я прочитал файл

data <- read.csv("data.csv", header = TRUE, sep = ",",stringsAsFactors = FALSE)

Преврати то, что мне нужно, в корпус

corp <- Corpus(VectorSource(data$text)) 

Это результат для метаданных

> meta(corp[[1]])
  author       : character(0)
  datetimestamp: 2019-09-20 20:48:45
  description  : character(0)
  heading      : character(0)
  id           : 1
  language     : en
  origin       : character(0)

Затем я пытаюсь добавить информацию об авторе, чтобы потом добавить дату и заголовок, как это

> for(i in 1:length(corp)) {
+ corp[[i]]$meta$author == data$author[i]
+ }

, но я продолжаю получать это

> abstract[[1]]$meta$author
character(0)
> meta(abstract[[1]], tag = 'author')
character(0)

, когда

> data$author[1]
[1] "Juan Vásquez Córdoba"

Как мне добавить правильную информацию метаданных в мой корпус?

1 Ответ

0 голосов
/ 21 сентября 2019

Я нашел ответ, объектный корпус должен быть таким:

corp <- VCorpus(VectorSource(data$text)) 

С V все работает

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...