Я делаю агрегатор для меню ресторанов на Java. Я ищу лучший способ извлечь содержимое документов, отформатированных различными способами: некоторые рестораны предоставляют RSS-канал, другие предоставляют HTML-таблицу, другим нужно компилировать результат, отображаемый на нескольких страницах ...
То, что я ищу, это способ описания преобразования, необходимого для перехода от исходного документа к легко разбираемому формату. Конечно, это преобразование должно быть индивидуальным и индивидуальным для каждого источника данных, но это не проблема.
Я знаю, что мог бы написать адаптер Java для каждого ресторана, но я ищу более простое, более стандартное решение. В основном что-то вроде XSLT, но более гибкое.
Есть идеи? Спасибо за вашу помощь.