У меня есть список названий растений на разных языках (ботанические имена; английский, немецкий и множество исторических вариантов этих двух языков) в XML (однако, преобразование его в любую сериализацию не будет проблемой). Вот как это выглядит сейчас:
<ingredients>
<ingredient>
<lemma>Rosmarinus officinalis L.</lemma>
<syn lang="deu">Rosmarin</syn>
<syn lang="ang">boþen</syn>
<syn lang="ang">feldmædere</syn>
<syn lang="ang">lauendie</syn>
<syn lang="eng">rosemary</syn>
<syn lang="ang">sundēaw</syn>
</ingredient>
<ingredient>
...
</ingredients>
Теперь мне стало интересно, есть ли способ автоматически назначать в этот список Викиданные и / или другие URI из контролируемых словарей. Конечно, учитывая управляемый уровень ошибок для строк, которые не соответствуют 100%. Какие подходы можно использовать для получения:
<ingredient wikidata="Q122679">
<lemma>Rosmarinus officinalis L.</lemma>
...
Спасибо за любые идеи!