Я хотел бы создать HTML-отчет, который визуализирует разницу между рядом очень похожих текстов. Я нашел пакет diffobj
, который делает то, что я хочу, если используется в интерактивном сеансе:
Однако я не могу понять, как отобразить это в отчете. Вот что я попробовал до сих пор:
---
title: "Repex"
output: html_document
---
```{r cars}
duplicates <- data.frame(text_original = "Lorem ipsum dolor sit amet, consectetur adipiscing elit. Maecenas laoreet risus et eros sagittis aliquam. Donec fringilla pharetra vestibulum. Fusce vestibulum imperdiet nibh ac rutrum. Aenean sollicitudin, tellus sed tempor varius, quam dolor ornare sapien, eu faucibus quam arcu vestibulum velit. Praesent maximus odio magna, in vulputate arcu cursus vitae. Praesent condimentum purus sit amet nisl vestibulum semper. Nunc quis eros ultricies, elementum eros sed, ullamcorper nunc. Nunc dictum commodo quam, et venenatis velit porta sit amet. Nunc et lorem et odio scelerisque vulputate sed at purus. Sed velit ipsum, consequat vel tristique tincidunt, semper in odio. Nullam pharetra laoreet velit quis sollicitudin. Fusce tellus felis, scelerisque id ipsum et, varius iaculis erat. Sed porttitor at quam sed rhoncus. Donec rutrum justo nec malesuada aliquam. Maecenas feugiat odio ac ante consequat, aliquet tempus magna tempus. Morbi convallis orci felis, ac ultricies ex dignissim in. Donec ornare vehicula ante eu interdum.",
text_duplicate = "Lorem dolor sit amet, consectetur elit. Maecenas laoreet risus et eros sagittis aliquam. Donec fringilla pharetra vestibulum. Fusce vestibulum imperdiet nibh ac rutrum. Aenean sollicitudin, tellus sed tempor varius, quam dolor ornare sapien, eu faucibus quam arcu vestibulum velit. Praesent maximus odio magna, in vulputate arcu cursus vitae. Praesent condimentum purus sit amet nisl vestibulum semper. Nunc quis eros ultricies, elementum sed, ullamcorper nunc. Nunc commodo quam, et venenatis velit porta sit amet. Nunc et lorem et odio scelerisque vulputate sed at purus. Sed velit ipsum, consequat vel tristique tincidunt, semper in odio. Nullam pharetra laoreet velit quis sollicitudin. Fusce tellus felis, scelerisque id ipsum et, varius iaculis erat. Sed porttitor at quam sed rhoncus. Donec rutrum justo nec malesuada aliquam. Maecenas feugiat odio ac ante consequat, aliquet tempus magna tempus. Morbi convallis orci felis, ac ultricies ex dignissim in. Donec ornare vehicula ante eu interdum.",
stringsAsFactors = FALSE)
library(diffobj)
for (i in 1) {
orig <- unname(unlist(quanteda::tokens(duplicates$text_original[i], what = "sentence")))
dup <- unname(unlist(quanteda::tokens(duplicates$text_duplicate[i], what = "sentence")))
diff <- diffPrint(current = orig,
target = dup,
format = "html",
interactive = FALSE)
print(diff)
}
```
Результатом при вязании этого файла является то, что HTML-код для каждого diff отображается, но не отображается. Обратите внимание, что я использовал цикл for с одной итерацией только для демонстрации. Настоящая задача - сделать около 50 различий.
Есть идеи, как решить эту проблему: настроить параметры diffPrint()
или rmarkdown
?