Диаграмма подмножества данных в R - PullRequest
0 голосов
/ 04 апреля 2019

Я новичок в R и хочу нанести на карту подмножество данных файла Excel, которые я загрузил в R.

Файл имеет 4 столбца с 690 000 строк / записей, в основном экономических показателей. 1. Страна (Австралия, Великобритания, США, Сингапур, Индия, Китай и т. Д.) 2. Индикатор (рост ВВП, инфляция, доходность облигаций, прямые иностранные инвестиции и т. Д.) 3. Дата (ежеквартально с начала 1990 года до конца 2030 года) 4. Значение

Например, я хотел бы построить линейный график в R, рост ВВП Австралии с 2000 по 2018 год. Следовательно, я бы исключил записи США, Великобритании, инфляции и дат после 2018 года. Я понимаю эту часть наверняка.

Я подумал, что мне нужно сначала получить подмножество данных. Но я не могу пройти через это. Какой код я использую? Сначала я объявляю переменную? Я думаю, что я могу построить его с помощью одной команды, но не знаю, как / с чего начать.

Изображения показывают данные по ВВП Австралии, а другие показывают другие строки (данные Нидерландов)

enter image description here

enter image description here

1 Ответ

0 голосов
/ 04 апреля 2019

Для начала нужны удобные библиотеки:

library(dplyr)
library(ggplot2)
# or library(tidyverse)

Затем вы можете использовать то, что @fmarm уже предложило в комментарии, и создать подмножество, подобное этому:

subset <- OE_All_Download_list %>% filter(Location=="Australia", Indicator == "GDP, real, annual growth")

и нанесите его с помощью базовых или ggplot2:

ggplot(data = subset, aes(x = Date, y = Value) +
    geom_line() +
    geom_point()    

Для получения дополнительной информации о заговорах я могу порекомендовать вам «поваренную книгу» . Чтобы узнать больше о своей задаче, попробуйте сначала найти вопросы о подмножестве. Это может быть помечено как дубликат.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...