Как я могу преобразовать данные Twitter в CSV-файл? - PullRequest
0 голосов
/ 19 марта 2020

Я анализирую данные Twitter и использую пакет rtweet для доступа к нужным мне данным. В основном это работает нормально, и я получаю твиты, которые я хочу. Моя проблема заключается в том, что мне нужно преобразовать данные в файл CSV, чтобы я мог открыть его в Excel.

Я попытался использовать следующий код, чтобы сохранить как CSV, но когда я открываю его в Excel, все перепутано вверх. write_as_csv(denmarkdotdk_tweets_organic, file_name = "DK1tweets.csv", prepend_ids = TRUE, na ="", fileEncoding = "UTF-8") save_as_csv(denmarkdotdk_tweets_organic, file_name="DK1tweets.csv", prepend_ids = TRUE, na = "", fileEncoding = "UTF-8")

До сих пор я загружал данные с помощью команд, показанных ниже. Я надеюсь, что у кого-то есть ответ на мои проблемы:)

#timeline for denmarkdotdk
denmarkdotdk <- get_timeline("@denmarkdotdk", n=3200)
denmarkdotdk

#remove retweets
denmarkdotdk_tweets_organic <- denmarkdotdk[denmarkdotdk$is_retweet==FALSE,] 

#remove replies
denmarkdotdk_tweets_organic <- subset(denmarkdotdk_tweets_organic, is.na(denmarkdotdk_tweets_organic$reply_to_status_id))
denmarkdotdk_tweets_organic

1 Ответ

0 голосов
/ 20 марта 2020

Пожалуйста, повторите загрузку данных с:

library(rtweet)
df <- search_tweets("@denmarkdotdk", n = 3200, include_rts = FALSE, retryonratelimit = TRUE)     #no retweets included
save_as_csv(df, "df.csv", prepend_ids = TRUE, na = "", fileEncoding = "UTF-8")

.. и ваш метод также работает с:

library(twitteR)
#timeline for denmarkdotdk
denmarkdotdk <- get_timeline("@denmarkdotdk", n=3200)
df <- as.data.frame(denmarkdotdk)
head(df)
#remove retweets
df1<- df[df$is_retweet==FALSE,] 
head(df1)
df2 <- df1[df1$reply_to_status_id=="NA",]
dim(df2)
head(df2)
df3  <- subset(df1,is.na(df1$reply_to_status_id))  # -replies
head(df3)
dim(df3)

save_as_csv(df3,"df3.csv",prepend_ids = TRUE, fileEncoding = "UTF-8")
...