Я получаю ошибку 'utf8towcs' при попытке почистить комментарии пользователей с YouTube - PullRequest
0 голосов
/ 31 марта 2019

Я пытаюсь почистить комментарии пользователей по марке смартфонов, и ниже приведена ошибка, которую я получаю при выполнении команды ниже R. Может ли кто-нибудь помочь мне получить исправление для этой проблемы.

Этот код несовместим и может иногда запускаться после установки пакетов tm и paramhelper.

ОШИБКА:

Ошибка в sort.list (y): неверный ввод 'plss удалите это дерьмовое видео поэтому люди не хотят красть телефоны lenovo oŸ˜Ÿ 'в' utf8towcs '

COMMAND:

videoIdData <- read.csv('D:\\DWBI Final Data\\VideoId.csv', stringsAsFactors = F)
str(videoIdData)

for (i in 1:length(videoIdData$videoID)){
  print(paste("The id is", i))

  commentSearchUrl <- "https://www.googleapis.com/youtube/v3/commentThreads?part=snippet%2C+replies&maxResults=100&textFormat=plainText&videoId=iTgmR4pcR9Q%20&fields=items%2CnextPageToken&key=AIzaSyAS-uSQhftToHWhbVYh1u5mqjNOvTUrGJ8"
  commentSearchUrl <- param_set(commentSearchUrl, key = "videoId", value = videoIdData$videoID[i] )
  print(commentSearchUrl)

  init_results <- httr::content(httr::GET(commentSearchUrl))
  data <- init_results$items

  if(length(data)!= 0){

    organize_data = function(){

      sub_data <- lapply(data, function(x) {
        data.frame(

          Comment = x$snippet$topLevelComment$snippet$textDisplay,
          Date = x$snippet$topLevelComment$snippet$publishedAt,
          stringsAsFactors=FALSE)
      })
    }

    sample <- organize_data()
    L <- length(sample)
    sample <- data.frame(matrix(unlist(sample), nrow=L, byrow=T))
    colnames(sample) <- c("Comment","Date")
    sample$Brand <- videoIdData$Brand[i]
    sample$Comment <- gsub("[^[:alnum:] ]", "", sample$Comment)

    sample$Comment <- sub("^\\s*<U\\+\\w+>\\s*", "", sample$Comment)
    sampleBrand <-sample[!grep("<U+1798>", sample$Comment),]
    sample$Date <- substring(sample$Date ,1,10)
    sample$Comment <- gsub("[[:punct:]]", "", sample$Comment)
    sample <- sample[sample$Date < "2018-09-01",]
    sample$Comment <- str_replace_all(sample$Comment, "[^[:alnum:]]", " ")

    write.table(sample, "Comments.csv", sep = ",", col.names = T, append = T,row.names = F)
  }
}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...