Как перечислить все уникальные значения для каждой категории - PullRequest
0 голосов
/ 07 февраля 2019

У меня есть две колонки, первая - это функция Бизнеса (Upstream, Downstream, Midstream и т. Д.), А другая - город, в котором работают эти функции. Есть множество других функций и городов, но я уменьшил их здесьи это выглядит примерно так:

Function      City
DownStream   Edmonton
Downstream   Edmonton
upstream     Edmonton
Upstream     Calgary
Midstream    Calgary
Midstream    Calgary
Midtream     Edmonton
Upstream     Vancouver

Я знаю, что функция unique () будет возвращать значения unqiue, которые я ищу, однако у меня возникают проблемы при создании чего-то, что сгруппирует столбец Function, а затем выдает списокуникальные города для каждой функции.

Примерно так: конечные результаты:

Functions  City

Downstream Edmonton


Midstream  Edmonton 
           Calgary 


Upstream   Edmonton
           Calgary
           Vancouver

Вот некоторые примеры данных для работы с

# Create sample data
Function=c("DownStream", "DownStream", "Upstream", "Upstream", "Midstream", 
           "Midstream", "Midstream", "Upstream")
City=c("Edmonton", "Edmonton", "Edmonton", "Calgary","Calgary", "Calgary",
       "Edmonton", "Vancouver")
df <- data.frame(Function, City)

Ответы [ 2 ]

0 голосов
/ 07 февраля 2019

Я бы предложил сначала получить уникальные строки, а затем заменить дубликаты на NA.

# Create sample data
Function=c("DownStream", "DownStream", "Upstream", "Upstream", "Midstream", 
           "Midstream", "Midstream", "Upstream")
City=c("Edmonton", "Edmonton", "Edmonton", "Calgary", "Calgary", "Calgary", 
       "Edmonton", "Vancouver")
df <- data.frame(Function, City)

# Get unique rows and replace duplicates with NA
unique_df <- unique(df)
unique_df[duplicated(unique_df[,"Function"]),"Function"] <- NA
print(unique_df)
0 голосов
/ 07 февраля 2019

Сначала создайте фрейм данных в R, например, df=data.frame(Function, City), затем просто unique(Function, City) даст результаты.
Или используйте пакет dplyr, затем запустите следующие коды df %>% group_by(Function) %>% distinct(City).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...