Я заинтересован в извлечении семантических данных (простых шаблонов) из веб-страниц и других источников, которые в настоящее время не семантически осведомлены.Я уже писал сканеры и ручной анализатор на множестве разных языков, но всегда, кажется, много шаблонного кода и кода для конкретной страницы, и мне было интересно, знаете ли вы, ребята, какие-нибудь платформы или платформы, которые упрощают процесстолько, пожалуйста).
Я напишу один, если не смогу его найти, поэтому ссылки на аналогичные системы или предложения по фреймворку также приветствуются.