Пример кода R для извлечения определенных столбцов - PullRequest
0 голосов
/ 19 марта 2019

Мои данные выглядят так:

      FlightID FareClass FareClassRank FareValue Bookings
1 YULCDG215135         Q             1       100        5
2 YULCDG215135         X             2       150        7
3 YULCDG215135         V             3       200        4
4 YULCDG215135         Y             4      1000        2
5 YULCDG215136         Q             1       120        1
6 YULCDG215136         X             2       200        4
7 YULCDG215136         V             3       270        5
8 YULCDG215136         Y             4       900       15

Вопрос: мне нужно написать простой код на R:

Для каждого рейса - отношение значения класса тарифа к значению его следующего класса тарифа.

Например, X - следующий класс тарифа Q, V - следующий класс тарифа X и т. Д.

Соотношение для полета YULCDG215135 составляет 100/150 = 0,6667 для X, 150/200 = 0,75 для V и так далее.

Ответы [ 3 ]

3 голосов
/ 19 марта 2019

Вот базовое решение R, использующее by.

by(df, df$FlightID, function(x) c(NA, exp(-diff(log(x$FareValue)))))
#df$FlightID: YULCDG215135
#[1]        NA 0.6666667 0.7500000 0.2000000
#------------------------------------------------------------
#df$FlightID: YULCDG215136
#[1]        NA 0.6000000 0.7407407 0.3000000

Или, альтернативно, ave

transform(df, ratio = ave(FareValue, FlightID, FUN = function(x) c(NA, exp(-diff(log(x))))))
#      FlightID FareClass FareClassRank FareValue Bookings     ratio
#1 YULCDG215135         Q             1       100        5        NA
#2 YULCDG215135         X             2       150        7 0.6666667
#3 YULCDG215135         V             3       200        4 0.7500000
#4 YULCDG215135         Y             4      1000        2 0.2000000
#5 YULCDG215136         Q             1       120        1        NA
#6 YULCDG215136         X             2       200        4 0.6000000
#7 YULCDG215136         V             3       270        5 0.7407407
#8 YULCDG215136         Y             4       900       15 0.3000000

Хитрость в обоих случаях заключается в лог-преобразовании FareValue чтобы мы могли использовать diff, а затем инвертировать преобразование (используя exp), чтобы получить соотношение.

2 голосов
/ 19 марта 2019
require(dplyr) 
df %>% 
group_by(FlightID) %>% 
arrange(FareClassRank) %>%
mutate(ratio=FareValue/lead(FareValue)) 
0 голосов
/ 19 марта 2019

Попробуйте это:

df$FareOverNext <- unlist(lappy(split(df$FareValue, df$FlightID), {
 c(1, x[1:(length(x) - 1)] / x[2:length(x)])
}))

EDIT:

Добавлено lapply и split благодаря комментарию @thelatemail.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...