Hei,
Для сравнения нескольких вариантов данных я подготовил отчет HTML. Учитывая особую категорию, некоторые индексы в базе данных должны быть одинаковыми. Для выявления ошибок / неправильных записей в базе данных я сравниваю различные категории в таблице. Для лучшего чтения было бы хорошо иметь цветные таблицы. Это можно легко сделать с помощью formattable-Package
.
Мой набор данных:
require(tidyverse)
require(formattable)
require(kableExtra)
require(knitr)
df1 <- data.frame(V1 = c(68,sample(c("J","N"),size=15,replace = TRUE)),
V2 = c(10,sample(c("J","N"),size=15,replace = TRUE)),
V3 = c(1,sample(c("J","N"),size=15,replace = TRUE))
)
. В этом примере - 3 различных варианта. Только один рекомендуется. Предполагается, что вариант с наибольшим N (= первая запись в каждом столбце Vx) является реальным.
Моя отформатированная таблица создается с таким кодом:
df1 %>%
mutate(
V2 = ifelse((as.character(V2) == as.character(V1)) == FALSE,
cell_spec(V2, color = "red",bold = TRUE),
cell_spec(V2, color = "black",bold = FALSE)),
V3 = ifelse((as.character(V3) == as.character(V1)) == FALSE,
cell_spec(V3, color = "red",bold = TRUE),
cell_spec(V3, color = "black",bold = FALSE))
) %>%
kable(format = "html", escape = FALSE) %>%
kable_styling(c("striped", "condensed"), full_width = FALSE) %>%
row_spec(1, bold = T, color = "white", background = "#D7261E")
Два вопроса:
- Как
mutate
в oop?
Это необходимо, потому что разные категории, которые я должен исследовать, могут иметь до 18 разных вариантов. В каждом наборе данных V1 всегда является эталонным вариантом.
Как вы видите (запустите код!), Первая строка («N») закодирована в неправильном вопросе. Можно ли сравнивать только со второй строки (по умолчанию для первой строки установлено значение ИСТИНА)
Это было бы хорошо, потому что первая строка теперь отформатирована в том, что на самом деле не делает чувство.
Спасибо!