Question

Я хочу аккуратно сравнить каждую строку df1 с одной строкой df2. Подскажите пожалуйста.

df1 <-
  structure(
    list(
        Q1 = c("a", "a")
      , Q2 = c("b", "a")
      , Q3 = c("a", "a")
      , Q4 = c("b", "a")
      )
    , class = "data.frame"
    , row.names = c(NA, -2L)
    )

df2 <-
  structure(
    list(
        Q1 = "a"
      , Q2 = "a"
      , Q3 = "b"
      , Q4 = "c"
      )
    , class = "data.frame"
    , row.names = c(NA, -1L)
    )

library(tidyverse)


sum(df1[1, ] == df2)
[1] 1
sum(df1[2, ] == df2)
[1] 2

Rui Barradas · Answer 1 · 18 июня 2020

Раствор основания R.

Сравните и просуммируйте по строкам:

rowSums(mapply(`==`, df1, df2))
#[1] 1 2

Редактировать.

Выше - новая версия этого поста. Оригинал просуммирован по столбцам. Вот код.

Возвращаемое значение - это список логических векторов, затем *apply функция sum.

Map(`==`, df1, df2)
#$Q1
#[1] TRUE TRUE
#
#$Q2
#[1] FALSE  TRUE
#
#$Q3
#[1] FALSE FALSE
#
#$Q4
#[1] FALSE FALSE

res <- Map(`==`, df1, df2)
sapply(res, sum)
#Q1 Q2 Q3 Q4 
# 2  1  0  0

Однострочным будет

sapply(Map(`==`, df1, df2), sum)

Еще один, быстрее.

colSums(mapply(`==`, df1, df2))
#Q1 Q2 Q3 Q4 
# 2  1  0  0

StupidWolf · Answer 2 · 18 июня 2020

Либо сначала разделите его и проверьте идентичность:

library(purrr)
asplit(df1,1) %>% map_dbl(~sum(.==df2))

Или просто сопоставьте номера строк:

1:nrow(df1) %>% map_dbl(function(i)sum(df1[i,]==df2))
[1] 1 2

akrun · Answer 3 · 18 июня 2020

Вариант с base R - rowSums

rowSums(df1 == unlist(df2)[col(df1)])
#[1] 1 2

В tidyverse мы также можем использовать c_across

library(dplyr)
df1 %>% 
    rowwise %>%
    mutate(new = sum(c_across(everything()) == df2)) 
# A tibble: 2 x 5
# Rowwise: 
#  Q1    Q2    Q3    Q4      new
#  <chr> <chr> <chr> <chr> <int>
#1 a     b     a     b         1
#2 a     a     a     a         2

det · Answer 4 · 18 июня 2020

Использование пакета purrr:

unlist_df2 <- unlist(df2)
    seq_len(nrow(df1)) %>%
      map_lgl(~identical(unlist(df1[.x,]), unlist_df2))

Для редактирования: замените map_lgl на map_dbl и идентично sum & ==

unlist_df2 <- unlist(df2)
seq_len(nrow(df1)) %>%
  map_dbl(~sum(unlist(df1[.x,]) == unlist_df2))

tidyverse: сравнение каждой строки data.frame с одной строкой из другого data.frame

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 5 ]

Редактировать.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

tidyverse: сравнение каждой строки data.frame с одной строкой из другого data.frame

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 5 ]

Редактировать.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы