Как я могу исключить строки Excel в R, если определенный тип форматирования характеризует ячейку (например, зачеркивание)?В частности, я хочу исключить строки, чья ячейка в столбце 1 имеет зачеркнутое форматирование («зачеркнутый»).Используя функции dplyr::join()
в сочетании с readxl::read_xlsx()
, я мог бы также работать только с вектором ячеек в столбце 1, содержащем поразительные значения.
Похоже, пакет tidyxl
- это путь.Применяя ответ @Wimpel к этому SO вопросу , о обнаружении стиля зачеркивания, я до сих пор имею:
xlfile <- 'PATH TO .XLSX FILE'
xlin <- xlsx_cells(xlfile)
formats <- tidyxl::xlsx_formats(xlfile)
cells <- tidyxl::xlsx_cells(xlfile, sheets = 1)
strike <- which( formats$local$font$strike )
strike_cells <- cells[ cells$local_format_id %in% strike, 2 ]
nostrike_cells <- cells[ !cells$local_format_id %in% strike, 2 ]
xl_new <- anti_join(xlin, strike_cells)
Однако я пока не знаюзнать, как добраться оттуда ( снимок экрана ниже ) во фрейм данных без исключенных ячеек.
Виньетка tidyxl
описывает полезное предотвращение приведения кадров в пакет, но у меня возникли проблемы с созданием окончательного кадра данных.
Возможно, у кого-то есть решение, использующее tidyxl
или другой пакет R, такой как openxlsx
?