Question

У меня есть фрейм данных этой формы:

df <- data.frame(country = rep(x = LETTERS[1:4], each = 5), year = rep(2001:2005), C=runif(20,30,100), Z=rnorm(20, mean = 0, sd = 1))

Я бы хотел для каждой страны определить значение Z, когда год == 2003, и разделить все значения C на это значение, чтобы значения C в каждой стране были разделены на несколько разных чисел, но число будет то же самое в пределах одной страны - и сохранить все это в каком-то новом векторе «Новое». Так, например, все значения в C для страны A будут разделены с -0,8012515, для страны B - с -0,62305076 и т. Д. Как я могу это сделать? Спасибо!

Jonathan · Answer 1 · 31 октября 2018

Другое решение, использующее базу R

Выписка Z за 2005 год для каждой страны

v1 <- df[df$year==2005,4]
создать вектор с правильной длиной для деления

z_2005 <- rep(x = v1[1:4],each = 5)
новый вектор <- C, деленный на Z для соответствующего года </p>
new <- df$C / Z_2005
Если вы хотите объединить новые столбцы со старым фреймом данных

df2 <- cbind(df,Z_2005,new)

Shree · Answer 2 · 31 октября 2018

Ваши данные не соответствуют примеру, которым вы поделились в своем сообщении. Вам нужно использовать set.seed(), чтобы сделать его воспроизводимым. В любом случае, вот решение с использованием dplyr -

set.seed(42)

df <- data.frame(country = rep(x = LETTERS[1:4], each = 5), 
                 year = rep(2001:2005),
                 C=runif(20,30,100),
                 Z=rnorm(20, mean = 0, sd = 1))

df %>%
  group_by(country) %>%
  mutate(
    New = C / Z[year == 2003]
  ) %>%
  pull(New)

# [1]  -67.70760  -68.83000  -36.02216  -63.45585  -53.94507  -24.97189  -30.70301
# [8]  -14.84183  -28.60558  -29.87234 -360.88226 -467.30510 -555.07518 -278.50602
# [15] -362.73532  -54.33474  -55.85181  -21.67929  -35.87291  -39.26086

r2evans · Answer 3 · 31 октября 2018

A data.table альтернатива @ Shree's dplyr:

set.seed(42)
dt <- data.table(country = rep(x = LETTERS[1:4], each = 5), year = rep(2001:2005), C=runif(20,30,100), Z=rnorm(20, mean = 0, sd = 1))
dt[,New := C/Z[year==2003],by="country"]
dt
#     country year        C          Z        New
#  1:       A 2001 94.03642  1.3048697  -67.70760
#  2:       A 2002 95.59528  2.2866454  -68.83000
#  3:       A 2003 50.02977 -1.3888607  -36.02216
#  4:       A 2004 88.13133 -0.2787888  -63.45585
#  5:       A 2005 74.92219 -0.1333213  -53.94507
#  6:       B 2001 66.33672  0.6359504  -24.97189
#  7:       B 2002 81.56118 -0.2842529  -30.70301
#  8:       B 2003 39.42666 -2.6564554  -14.84183
#  9:       B 2004 75.98946 -2.4404669  -28.60558
# 10:       B 2005 79.35453  1.3201133  -29.87234
# 11:       C 2001 62.04192 -0.3066386 -360.88226
# 12:       C 2002 80.33786 -1.7813084 -467.30510
# 13:       C 2003 95.42706 -0.1719174 -555.07518
# 14:       C 2004 47.88002  1.2146747 -278.50602
# 15:       C 2005 62.36050  1.8951935 -362.73532
# 16:       D 2001 95.80102 -0.4304691  -54.33474
# 17:       D 2002 98.47585 -0.2572694  -55.85181
# 18:       D 2003 38.22412 -1.7631631  -21.67929
# 19:       D 2004 63.24980  0.4600974  -35.87291
# 20:       D 2005 69.22329 -0.6399949  -39.26086

И опция, которая не использует ни data.table, ни dplyr:

do.call(rbind,
        by(df, df$country, FUN = function(a) transform(a, New = C/Z[year==2003])))

Bing · Answer 4 · 31 октября 2018

Используйте разделение и обработайте каждый набор данных отдельно, затем объедините их

r=sapply(split(df, df$country), function(x)New=x$Z/x$Z[x$year==2003])
d=tidyr::gather(as.data.frame(r),Country, New)

редактирует

set.seed(0)
df <- data.frame(country = rep(x = LETTERS[1:4], each = 5), year = rep(2001:2005), C=runif(20,30,100), Z=rnorm(20, mean = 0, sd = 1))

r=sapply(split(df, df$country), function(x)New=x$Z/x$Z[x$year==2003])
d=tidyr::gather(as.data.frame(r),country, New)

cbind(df, d)

новый вектор в r значениями другого вектора

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

новый вектор в r значениями другого вектора

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов