Существуют ли какие-либо инструменты или приемы, как автоматически извлекать таблицы из PDF-файлов. Есть ли библиотеки C #, которые могли бы это сделать? Или вы знаете другие способы, как это можно сделать?
Большое спасибо
я нашел интересный сайт и одну магистерскую диссертацию на эту тему
Извлечение информации - использование шаблонов таблиц
http://ieg.ifs.tuwien.ac.at/projects/pdf2table/
, если кто-то найдет больше информации, пожалуйста, продолжайтеотправка ...
PDF-файлы не содержат табличных структур - некоторые инструменты попытаются их угадать.