Я работаю над анализом Твиттера. Я пытаюсь автоматизировать извлечение хронологии подписчиков определенной учетной записи Twitter.
Это мой код
library(tidyverse)
library(rtweet)
set.seed(1234)
filas <- nrow(twitter)
muestra <- sample(filas*0.30)
twitter_sample <- twitter[muestra,]
twitter_sample$Nick.del.Cliente <- as.character(twitter_sample$Nick.del.Cliente)
i <- 1
for (i in 1:length(muestra)){
usuario <- paste('@', twitter_sample$Nick.del.Cliente, sep = '' )
}
(usuario)
j <- 1
texto <- data.frame(matrix(ncol = 283, nrow = 100))
tipo <- data.frame(matrix(ncol = 283, nrow = 100))
cantidad <- data.frame(matrix(ncol = 283, nrow = 100))
for (j in 1:283){
total <- get_timeline(usuario[j], n =100, include_rts = F)
texto[,j] <- total$text
tipo[,j] <- total$source
cantidad[,j] <- total$display_text_width
}
Я выбрал репрезентативную выборку подписчиков, затем добавил «@» для каждого пользователя с идентификатором и создать список с идентификатором «usuario» (usuario означает пользователя на испанском языке sh).
Затем я создал 3 пустых фрейма данных, когда столбцы равны количество пользователей, которые у меня есть, и строки равны количеству твитов, которые мне нужны.
В 'вместо' мне нужны следующие вещи:
- Доступ к временной шкале первого пользователя
- Возьмите столбец 'text' и добавьте его в первый столбец фрейма данных 'texto'
- Возьмите столбец 'source' и добавьте его в первый столбец фрейма данных 'tipo'
- Возьмем display_text_width; и добавьте его в первый столбец фрейма данных cantidad
Затем повторите то же самое со вторым пользователем и добавьте ту же информацию во второй столбец к фреймам данных, а затем к третьим пользователям и т. д. c ...
Когда я запускаю второй 'for', я получаю эту ошибку.
Error in `[<-.data.frame`(`*tmp*`, , j, value = c("@Bellealouette Influencia? Quien es ella que no sabe que es influenza?", :
replacement has 96 rows, data has 100.
Если я изменяю размер фрейма данных, ошибка будет такой же, но с другими числами
Error in `[<-.data.frame`(`*tmp*`, , j, value = c("@Bellealouette Influencia? Quien es ella que no sabe que es influenza?", :
replacement has 78 rows, data has 80
[Это пример того, что мне нужно