R: Суммирование 3 самых высоких значений в каждой строке - PullRequest
0 голосов
/ 25 октября 2018

Заранее спасибо!

У меня есть матрица в R:

         Room 1     Room 2     Room 3     Room 4     Room 5
House 1  10         30         80         20         10
House 2  20         10         80         10         30
House 3  10         10         20         60         50

Я хотел бы добавить столбец с суммой трех самых высоких значений:

         Room 1     Room 2     Room 3     Room 4     Room 5     Sum
House 1  10         30         80         20         10         130 (=80+30+20)
House 2  20         10         90         10         30         140 (=90+30+20)
House 3  10         10         20         60         10         90  (=60+20+10)

Как вы можетесм. в строке 3, если существует более одного значения с одинаковой высотой, следует просто использовать 1 из значений.

Кто-нибудь может помочь?Спасибо!

Я надеюсь, что это воспроизводимый пример:

m <- matrix(c(10,30,80,20,10,20,10,80,10,30,10,10,20,60,50),ncol=5,byrow=TRUE)
colnames(m) <- c("Room1","Room2","Room3","Room4","Room5")
rownames(m) <- c("House1","House2","House3")
m <- as.matrix(m)

Исходная матрица представляет собой большую матрицу, 100500 элементов, 1005 записей и 100 столбцов:

dput(head(matrixtopicProbabilities,1))
    structure(c(0.000634786288616166, 0.000634786288616166, 0.000634786288616166, 
    0.115742699957681, 0.000634786288616166, 0.000211595429538722, 
    0.00275074058400339, 0.000211595429538722, 0.00698264917477782, 
    0.00359712230215827, 0.000634786288616166, 0.0086754126110876, 
    0.000634786288616166, 0.00232754972492594, 0.14409648751587, 
    0.000211595429538722, 0.000211595429538722, 0.00105797714769361, 
    0.276132035548032, 0.0019043588658485, 0.00148116800677105, 0.00317393144308083, 
    0.00105797714769361, 0.00275074058400339, 0.000634786288616166, 
    0.0158696572154041, 0.00275074058400339, 0.000211595429538722, 
    0.00275074058400339, 0.000634786288616166, 0.000211595429538722, 
    0.000211595429538722, 0.000211595429538722, 0.00909860347016504, 
    0.000211595429538722, 0.00148116800677105, 0.000211595429538722, 
    0.000634786288616166, 0.00105797714769361, 0.00148116800677105, 
    0.00571307659754549, 0.00105797714769361, 0.000211595429538722, 
    0.00105797714769361, 0.00232754972492594, 0.0175624206517139, 
    0.000634786288616166, 0.00105797714769361, 0.000634786288616166, 
    0.00148116800677105, 0.000634786288616166, 0.000634786288616166, 
    0.00148116800677105, 0.000211595429538722, 0.000211595429538722, 
    0.00359712230215827, 0.00528988573846805, 0.000634786288616166, 
    0.000211595429538722, 0.000634786288616166, 0.000634786288616166, 
    0.000634786288616166, 0.0175624206517139, 0.000634786288616166, 
    0.00232754972492594, 0.000211595429538722, 0.00359712230215827, 
    0.0298349555649598, 0.000634786288616166, 0.000211595429538722, 
    0.0019043588658485, 0.000211595429538722, 0.0019043588658485, 
    0.000211595429538722, 0.000211595429538722, 0.0230639018197207, 
    0.00359712230215827, 0.00655945831570038, 0.00317393144308083, 
    0.000634786288616166, 0.00105797714769361, 0.0387219636055861, 
    0.00148116800677105, 0.00402031316123572, 0.00232754972492594, 
    0.000211595429538722, 0.0247566652560305, 0.0217943292424884, 
    0.000211595429538722, 0.0772323317816335, 0.00571307659754549, 
    0.00148116800677105, 0.000211595429538722, 0.00105797714769361, 
    0.000211595429538722, 0.000634786288616166, 0.00105797714769361, 
    0.00148116800677105, 0.000211595429538722, 0.0590351248413034
    ), .Dim = c(1L, 100L), .Dimnames = list("company1", c("V1", "V2", 
    "V3", "V4", "V5", "V6", "V7", "V8", "V9", "V10", "V11", "V12", 
    "V13", "V14", "V15", "V16", "V17", "V18", "V19", "V20", "V21", 
    "V22", "V23", "V24", "V25", "V26", "V27", "V28", "V29", "V30", 
    "V31", "V32", "V33", "V34", "V35", "V36", "V37", "V38", "V39", 
    "V40", "V41", "V42", "V43", "V44", "V45", "V46", "V47", "V48", 
    "V49", "V50", "V51", "V52", "V53", "V54", "V55", "V56", "V57", 
    "V58", "V59", "V60", "V61", "V62", "V63", "V64", "V65", "V66", 
    "V67", "V68", "V69", "V70", "V71", "V72", "V73", "V74", "V75", 
    "V76", "V77", "V78", "V79", "V80", "V81", "V82", "V83", "V84", 
    "V85", "V86", "V87", "V88", "V89", "V90", "V91", "V92", "V93", 
    "V94", "V95", "V96", "V97", "V98", "V99", "V100")))

1 Ответ

0 голосов
/ 25 октября 2018

Я бы порекомендовал разбить проблему на несколько частей.Сначала создайте функцию, которая вычисляет сумму трех самых высоких значений.Затем примените функцию к матрице.Наконец добавьте столбец со значениями суммы в матрицу.Я создаю пример кода ниже, используя ваш пример.

# Sample data
m <- matrix(c(10,30,80,20,10,
              20,10,80,10,30,
              10,10,20,60,50),ncol=5,byrow=TRUE)
colnames(m) <- c("Room1","Room2","Room3","Room4","Room5")
rownames(m) <- c("House1","House2","House3")
print(m)

# Function to sum the three highest values:
SumTopThree <- function(vec) {
  sortVec <- vec[order(vec, decreasing=TRUE)]
  return(sum(sortVec[1:3]))
}

# Apply the function to your matrix
Sum <-  apply(m, 1, SumTopThree)

# Add the column to the matrix
m <- cbind(m, Sum)
print(m)

Надеюсь, это приблизит вас к решению!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...