Ошибка автоматизации извлечения твитов в R - PullRequest
0 голосов
/ 04 мая 2020

Я работаю над анализом Твиттера. Я пытаюсь автоматизировать извлечение хронологии подписчиков определенной учетной записи Twitter.

Это мой код

library(tidyverse)
library(rtweet)

set.seed(1234)


filas <- nrow(twitter)
muestra <- sample(filas*0.30)

twitter_sample <- twitter[muestra,]

twitter_sample$Nick.del.Cliente <- as.character(twitter_sample$Nick.del.Cliente)

i <- 1

for (i in 1:length(muestra)){
  usuario <- paste('@', twitter_sample$Nick.del.Cliente, sep = '' )
  }

(usuario)

j <- 1

texto <-  data.frame(matrix(ncol = 283, nrow = 100))
tipo <- data.frame(matrix(ncol = 283, nrow = 100))
cantidad <- data.frame(matrix(ncol = 283, nrow = 100))



for (j in 1:283){
  total <- get_timeline(usuario[j], n =100, include_rts = F)
  texto[,j] <- total$text
  tipo[,j] <- total$source
  cantidad[,j] <- total$display_text_width
}

Я выбрал репрезентативную выборку подписчиков, затем добавил «@» для каждого пользователя с идентификатором и создать список с идентификатором «usuario» (usuario означает пользователя на испанском языке sh).

Затем я создал 3 пустых фрейма данных, когда столбцы равны количество пользователей, которые у меня есть, и строки равны количеству твитов, которые мне нужны.

В 'вместо' мне нужны следующие вещи:

  1. Доступ к временной шкале первого пользователя
  2. Возьмите столбец 'text' и добавьте его в первый столбец фрейма данных 'texto'
  3. Возьмите столбец 'source' и добавьте его в первый столбец фрейма данных 'tipo'
  4. Возьмем display_text_width; и добавьте его в первый столбец фрейма данных cantidad

Затем повторите то же самое со вторым пользователем и добавьте ту же информацию во второй столбец к фреймам данных, а затем к третьим пользователям и т. д. c ...

Когда я запускаю второй 'for', я получаю эту ошибку.

Error in `[<-.data.frame`(`*tmp*`, , j, value = c("@Bellealouette Influencia? Quien es ella que no sabe que es influenza?",  : 
  replacement has 96 rows, data has 100.

Если я изменяю размер фрейма данных, ошибка будет такой же, но с другими числами

Error in `[<-.data.frame`(`*tmp*`, , j, value = c("@Bellealouette Influencia? Quien es ella que no sabe que es influenza?",  : 
  replacement has 78 rows, data has 80

[Это пример того, что мне нужно This is an example of what I need

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...