вложенный sapply в R - разбивка - PullRequest
0 голосов
/ 29 марта 2020

Этот пост связан с моим предыдущим вопросом об извлечении данных из вложенных списков, на которые дан ответ. Один из ответов содержит sapply функцию:

usageExist <- sapply(garden$fruit, function(f){
  sapply(garden$usage, '%in%', x = names(productFruit$type[[f]][["usage"]]))}) 

Я очень новичок в data.table и применяю функции и изо всех сил пытаюсь понять:

что происходит в этом конкретная строка кода ?

Почему cooking появляется дважды в списках после выполнения usageExists?

Какова цель аргумента f в функции в пределах sapply

Структура и результаты данных приведены ниже:

> str(productFruit)
List of 2
 $ Basket: chr "DUH"
 $ type  :List of 3
  ..$ Fruit 1124:List of 3
  .. ..$ ID   : num 1
  .. ..$ color: chr "poor"
  .. ..$ usage:List of 2
  .. .. ..$ eating  :List of 3
  .. .. .. ..$ ID      : num 1
  .. .. .. ..$ quality : chr "good"
  .. .. .. ..$ calories: num 500
  .. .. ..$ medicine:List of 3
  .. .. .. ..$ ID      : num 2
  .. .. .. ..$ quality : chr "poor"
  .. .. .. ..$ calories: num 300
  ..$ Fruit 1068:List of 3
  .. ..$ ID   : num [1:3] 1 2 3
  .. ..$ color: num [1:3] 3 4 5
  .. ..$ usage:List of 4
  .. .. ..$ eating  :List of 3
  .. .. .. ..$ ID      : num 1
  .. .. .. ..$ quality : chr "poor"
  .. .. .. ..$ calories: num 420
  .. .. ..$ cooking :List of 3
  .. .. .. ..$ ID      : num 2
  .. .. .. ..$ quality : chr "questionable"
  .. .. .. ..$ calories: num 600
  .. .. ..$ drinking:List of 3
  .. .. .. ..$ ID      : num 3
  .. .. .. ..$ quality : chr "good"
  .. .. .. ..$ calories: num 800
  .. .. ..$ medicine:List of 3
  .. .. .. ..$ ID      : num 4
  .. .. .. ..$ quality : chr "good"
  .. .. .. ..$ calories: num 0
  ..$ Fruit 1051:List of 3
  .. ..$ ID   : num [1:3] 1 2 3
  .. ..$ color: num [1:3] 3 4 5
  .. ..$ usage:List of 3
  .. .. ..$ cooking :List of 3
  .. .. .. ..$ ID      : num 1
  .. .. .. ..$ quality : chr "good"
  .. .. .. ..$ calories: num 49
  .. .. ..$ drinking:List of 3
  .. .. .. ..$ ID      : num 2
  .. .. .. ..$ quality : chr "questionable"
  .. .. .. ..$ calories: num 11
  .. .. ..$ medicine:List of 3
  .. .. .. ..$ ID      : num 3
  .. .. .. ..$ quality : chr "poor"
  .. .. .. ..$ calories: num 55


> str(garden)
Classes ‘data.table’ and 'data.frame':  5 obs. of  3 variables:
 $ fruit   : chr  "Fruit 1124" "Fruit 100" "Fruit 1051" "Fruit 1068" ...
 $ usage   : chr  "cooking" "cooking" "NA" "drinking" ...
 $ reported: chr  "200" "500" "77" "520" ...
 - attr(*, ".internal.selfref")=<externalptr> 


> fruitExist <- fruit %in% names(productFruit$type) 
> fruitExist
[1]  TRUE FALSE  TRUE  TRUE FALSE


> usageExist <- sapply(garden$fruit, function(f){
+   sapply(garden$usage, '%in%', x = names(productFruit$type[[f]][["usage"]]))}) # return a list of 5
> usageExist
$`Fruit 1124`
     cooking cooking    NA drinking medicine
[1,]   FALSE   FALSE FALSE    FALSE    FALSE
[2,]   FALSE   FALSE FALSE    FALSE     TRUE

$`Fruit 100`
$`Fruit 100`$cooking
logical(0)

$`Fruit 100`$cooking
logical(0)

$`Fruit 100`$`NA`
logical(0)

$`Fruit 100`$drinking
logical(0)

$`Fruit 100`$medicine
logical(0)


$`Fruit 1051`
     cooking cooking    NA drinking medicine
[1,]    TRUE    TRUE FALSE    FALSE    FALSE
[2,]   FALSE   FALSE FALSE     TRUE    FALSE
[3,]   FALSE   FALSE FALSE    FALSE     TRUE

$`Fruit 1068`
     cooking cooking    NA drinking medicine
[1,]   FALSE   FALSE FALSE    FALSE    FALSE
[2,]    TRUE    TRUE FALSE    FALSE    FALSE
[3,]   FALSE   FALSE FALSE     TRUE    FALSE
[4,]   FALSE   FALSE FALSE    FALSE     TRUE

$`Fruit 1`
$`Fruit 1`$cooking
logical(0)

$`Fruit 1`$cooking
logical(0)

$`Fruit 1`$`NA`
logical(0)

$`Fruit 1`$drinking
logical(0)

$`Fruit 1`$medicine
logical(0)

1 Ответ

0 голосов
/ 29 марта 2020

Ну, это, по сути, вложенное l oop. sapply(x, function(f) ...) просто берет каждый элемент в x и передает его в качестве аргумента f функции. Эта функция в вашем случае является просто еще одним оператором sapply.

Итак, usageExist <- sapply(garden$fruit, function(f){...} просто передает каждый fruit в garden в функцию. В вашем случае это влияет names(productFruit$type[[**f**]][["usage"]]. Например, для первого он передает Fruit 1124 из garden во второе хранилище, где productFruit$type[[f]] ищет Fruit 1124 из productFruit и, в частности, элемент usage этого списка.

Второй sapply, с другой стороны, берет каждый элемент garden$usage и передает его в функцию %in%. Вы получаете cooking дважды, потому что, как вы можете видеть в выводе str, в этих данных он появляется дважды, что имеет смысл, поскольку вы можете готовить разнообразные фрукты и овощи, а не только один.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...