Я пытаюсь извлечь изображения из научных статей. Научными областями, вероятно, будут психология и лингвистика, поэтому большинство графиков представляют собой графики средств (например, столбчатые и линейные графики), диаграммы рассеяния, графики регрессии.
Я хотел бы затем дать количественную оценку сложности или переполненности этих изображений. Меня интересует, насколько насыщенной была визуализация данных. Например, гистограммы обеднены относительно графиков, которые показывают базовые данные (например, дрожание).
Я пытался найти подходящую литературу, но это немного экспериментально и ограничено во времени (я нахожусь в мастерской, где мы пытаемся завершить новый проект через несколько дней). Будучи наивным к анализу изображений, я не смог найти ничего, что могло бы сделать это.
Я могу использовать пакет R (но не Python, поскольку у меня нет опыта работы с этим). Я также могу попробовать бесплатное программное обеспечение.