См. этот ресурс для вашего движка.
Вы должны научиться искать и использовать существующие ресурсы (онтологии и, в более общем смысле, API), которые позволяют повторно использовать семантические аннотации к данным. (Связанные данные см. здесь ). В любом случае, если вы получаете веб-ресурсы, не помещают их в файлы и ссылаются на источник, поскольку копия изменяет семантические ссылки. Знания развиваются со временем ...
Относительно семантического анализа, может быть трудной задачей. Прежде чем начать реализовывать себя, поищите, есть ли какой-нибудь API , который соответствует вашему счету.