Проблемы преобразования данных для временных рядов - PullRequest
0 голосов
/ 30 марта 2020

У меня есть один вопрос. У меня есть одна база данных с двумя переменными в двух столбцах: бренд и цена. Например: 2 марки и их цены

ЦЕНА БРЕНДА

A 10,5

A 11,5

A 12,5

B 9,8

B 9,5

И есть еще бренды и цены.

Я хотел бы преобразовать данные и поместить в каждую строку марку без дубликатов и цены в одном столбце, но все вместе как фактор и разделенные запятыми

Это было так:

ЦЕНА БРЕНДА

A {10.5,11.5,12.5}

B {9,8 , 9,5}

Может ли кто-нибудь помочь мне с этим?

Спасибо

Ниже один пример оригинала данных

введите описание изображения здесь

1 Ответ

0 голосов
/ 30 марта 2020

Добро пожаловать в stackoverflow. В будущем см. , как сделать отличный воспроизводимый пример поста для вопросов.

Я думаю, что вы хотите сделать, это просто сгруппировать и объединить. Объединение строк по группам с помощью dplyr

Поскольку вам нужны только уникальные бренды, вы просто slice сделаете это.

library(dplyr)

df <- data.frame(brand = c("A", "A", "A", "B", "B"), price = c(10.5,11.5,12.5,9.8,9.5))

df %>% 
  group_by(brand) %>% 
  mutate(brand_price = paste0(price, collapse = ",")) %>% 
  select(brand, brand_price) %>% 
  slice(1)

> tdf
# A tibble: 2 x 2
# Groups:   brand [2]
  brand brand_price   
  <fct> <chr>         
1 A     10.5,11.5,12.5
2 B     9.8,9.5  
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...