Я пытаюсь почистить комментарии пользователей по марке смартфонов, и ниже приведена ошибка, которую я получаю при выполнении команды ниже R. Может ли кто-нибудь помочь мне получить исправление для этой проблемы.
Этот код несовместим и может иногда запускаться после установки пакетов tm и paramhelper.
ОШИБКА:
Ошибка в sort.list (y): неверный ввод 'plss удалите это дерьмовое видео
поэтому люди не хотят красть телефоны lenovo oŸ˜Ÿ 'в' utf8towcs '
COMMAND:
videoIdData <- read.csv('D:\\DWBI Final Data\\VideoId.csv', stringsAsFactors = F)
str(videoIdData)
for (i in 1:length(videoIdData$videoID)){
print(paste("The id is", i))
commentSearchUrl <- "https://www.googleapis.com/youtube/v3/commentThreads?part=snippet%2C+replies&maxResults=100&textFormat=plainText&videoId=iTgmR4pcR9Q%20&fields=items%2CnextPageToken&key=AIzaSyAS-uSQhftToHWhbVYh1u5mqjNOvTUrGJ8"
commentSearchUrl <- param_set(commentSearchUrl, key = "videoId", value = videoIdData$videoID[i] )
print(commentSearchUrl)
init_results <- httr::content(httr::GET(commentSearchUrl))
data <- init_results$items
if(length(data)!= 0){
organize_data = function(){
sub_data <- lapply(data, function(x) {
data.frame(
Comment = x$snippet$topLevelComment$snippet$textDisplay,
Date = x$snippet$topLevelComment$snippet$publishedAt,
stringsAsFactors=FALSE)
})
}
sample <- organize_data()
L <- length(sample)
sample <- data.frame(matrix(unlist(sample), nrow=L, byrow=T))
colnames(sample) <- c("Comment","Date")
sample$Brand <- videoIdData$Brand[i]
sample$Comment <- gsub("[^[:alnum:] ]", "", sample$Comment)
sample$Comment <- sub("^\\s*<U\\+\\w+>\\s*", "", sample$Comment)
sampleBrand <-sample[!grep("<U+1798>", sample$Comment),]
sample$Date <- substring(sample$Date ,1,10)
sample$Comment <- gsub("[[:punct:]]", "", sample$Comment)
sample <- sample[sample$Date < "2018-09-01",]
sample$Comment <- str_replace_all(sample$Comment, "[^[:alnum:]]", " ")
write.table(sample, "Comments.csv", sep = ",", col.names = T, append = T,row.names = F)
}
}