Автоматически назначать URI Wikidata списку имен - PullRequest
0 голосов
/ 31 октября 2018

У меня есть список названий растений на разных языках (ботанические имена; английский, немецкий и множество исторических вариантов этих двух языков) в XML (однако, преобразование его в любую сериализацию не будет проблемой). Вот как это выглядит сейчас:

<ingredients>
  <ingredient>
    <lemma>Rosmarinus officinalis L.</lemma>
    <syn lang="deu">Rosmarin</syn>
    <syn lang="ang">boþen</syn>
    <syn lang="ang">feldmædere</syn>
    <syn lang="ang">lauendie</syn>
    <syn lang="eng">rosemary</syn>
    <syn lang="ang">sundēaw</syn>
  </ingredient>
  <ingredient>
    ...
</ingredients>

Теперь мне стало интересно, есть ли способ автоматически назначать в этот список Викиданные и / или другие URI из контролируемых словарей. Конечно, учитывая управляемый уровень ошибок для строк, которые не соответствуют 100%. Какие подходы можно использовать для получения:

 <ingredient wikidata="Q122679">
    <lemma>Rosmarinus officinalis L.</lemma>
    ...

Спасибо за любые идеи!

1 Ответ

0 голосов
/ 05 ноября 2018

Просто хотел сказать, что OpenRefine делает именно то, что мне нужно!

...