Горные финансовые статьи R - PullRequest
0 голосов
/ 21 января 2020

Я работаю над некоторыми финансовыми статьями, используя tidytext, я загружаю данные из Reuters, но затем, когда я пытаюсь превратить каждый корпус в фрейм данных, я получаю некоторые ошибки о том, что команда unnest не принимает функции в качестве входных данных ... .

Есть ли у вас какие-либо альтернативы, чтобы превратить это в тибл?

library(tm.plugin.webmining)
library(purrr)
company <- c("Microsoft", "Apple", "Google", "Amazon", "Facebook",
             "Twitter", "IBM", "Yahoo", "Netflix")

symbol <- c("MSFT", "AAPL", "GOOG", "AMZN", "FB", "TWTR", "IBM", "YHOO", "NFLX")

download_articles <- function(symbol) {
  WebCorpus(ReutersNewsSource(paste0("NASDAQ:", symbol)))
}

stock_articles <- data_frame(company = company, symbol = symbol) %>%
  mutate(corpus = map(symbol, download_articles))

stock_articles

stock_tokens <- stock_articles %>%
  unnest(map(corpus, tidy)) %>%
  unnest_tokens(word, text) %>%
  select(company, datetimestamp, word, id, heading)
stock_tokens

Ответы [ 2 ]

0 голосов
/ 27 января 2020

В данном случае, к сожалению, некоторые службы устарели, а tm.plugin.webmining устарел. Вы можете прочитать более подробную информацию здесь . Мы ищем набор данных для замены для этой части нашей книги, но в то же время, если вы захотите изучить использование этого кода, я бы рекомендовал сократить, скажем, до 4 компаний, которые все еще работают.

symbol <- c("MSFT", "AAPL", "AMZN", "IBM")
0 голосов
/ 22 января 2020

Я пытаюсь преобразовать столбец корпуса stock_articles в обычный фрейм данных

Это список-столбец с переменной типа WebCorpus, поэтому я пытаюсь привести в порядок каждое наблюдение и затем превратить его в столбец с использованием unnest

[1]: https://github.com/leytigeorges/miningfinancial здесь вы можете найти файл с данными (mydata)

...