Я знаю, что можно встраивать RDFa в документы XHTML.Есть ли какой-нибудь общепринятый способ сделать это для PDF?(Под «стандартом» я подразумеваю то, что распознают крупные поисковые системы.)
См. Спецификации XMP : (http://www.adobe.com/products/xmp/ и http://en.wikipedia.org/wiki/Extensible_Metadata_Platform). Некоторые научные издатели заполняют метаданные своих PDF-файлов (например, www.nature.com)
Стандартный способ семантической маркировки данных в документе PDF?
Да, есть. Это называется «Помеченный контент». Вы можете прочитать об этом в Главе 10 - Обмен документами, Часть 10.5 - Помеченное содержание PDF Reference, шестое издание