Есть ли способ извлечь изображение из файла Excel с помощью R? Затем он может быть помещен в тессеракт ocr - PullRequest
2 голосов
/ 04 марта 2020

У меня есть несколько файлов Excel с изображениями на одном из листов. Есть ли способ извлечь изображение (путь изображения) в R, чтобы затем поместить его в тессеракт ocr.

Ранее я использовал функцию пакета openxlsx loadWorkbook:

wb <- openxlsx::loadWorkbook("C:/Users/.../test_file.xlsx")

при выводе wb:

A Workbook object.

Worksheets:
 Sheet 1: "Sheet1"



Images:
 Image 1: "C:/Users/..../AppData/Local/Temp/RtmpuUQZm7//file41e..._openxlsx_loadworkbook/xl/media/image1.png"
 Worksheet write order: 1

Есть ли способ получить этот путь к изображению? Переменная типа является объектом рабочей книги, и когда вы делаете тип, это "S4", поэтому кажется, что я не могу преобразовать его в символ и вытащить путь.

1 Ответ

0 голосов
/ 04 марта 2020

Вы можете получить доступ к пути изображения с помощью слота @media вашего объекта рабочей книги.

Вот пример построения PNG, сохраненного в файле xlsx:

require(png)
require(openxlsx)
require(grid)

wb  <- openxlsx::loadWorkbook("~/img.xlsx")
img <- png::readPNG(wb@.xData$media[1])
grid::grid.newpage()
grid::grid.raster(img)

Создано в 2020-03-04 пакетом Представить (v0.3.0)

...