Это очень хороший вопрос. Приложения, которые создают PDF-файлы, похоже, не делают ничего полезного с доступными полями метаданных.
Взять в качестве примера pdflatex : даже если в преамбуле указаны \ title {...} и \ author {...} эта информация не отражена в метаданных. После быстрого поиска решение, по-видимому, заключается в том, чтобы ввести в преамбулу блок, доступный только для чтения pdflatex [1]:
\pdfinfo
{
/Title{...}
/Author{...}
...
}
... который затем помещается в соответствующие поля метаданных PDF. Странно, однако, что это необходимо.
Я не могу говорить за текстовые процессоры, такие как Word или Writer. Предполагается, что такие поля метаданных должны быть установлены пользователем вручную.
Возможно, эвристический подход - единственный способ решить проблему, если ваши PDF-файлы не созданы вами. [2] кажется, что он делает что-то похожее на то, что вы хотите, но я думаю, это зависит от того, насколько хорошо опубликованы PDF-файлы - этот инструмент, похоже, ориентирован на научные статьи.
Надеюсь, это хоть какая-то помощь.
[1] http://wlug.org.nz/PdfLatexNotes
[2] http://www.molspaces.com/d_cb2bib-metadata.php