Здесь вам нужно решить две отдельные задачи:
- Решение, какие слова должны быть связаны
- Определение наличия подходящей записи для связи этих слов с
Теперь (2) проще, хотя и несколько проблематично. В Википедии, похоже, есть API , который позволяет эффективно собирать данные, а также позволяет "очистку экрана". Но есть проблема с устранением неоднозначности - иногда вы можете нажать не ту запись, которую хотели. Например, python ссылается на страницу устранения неоднозначности, так как это может быть язык программирования, змея и пара других вещей.
(1) Хотя намного сложнее. Вы можете воспользоваться «простым подходом» и попытаться найти ссылки для всех нетривиальных существительных (или даже пар существительное / прилагательное). Нетривиально здесь означает опускание таких слов, как «злодей, слово, компьютер» и т. Д.
Но это приведет к множеству ссылок, которые не удобно читать. Вам решать, что интересного в тексте, и это во многом зависит от самого текста. В статье для профессиональных программистов вы действительно хотите каждый раз ссылаться на «алгоритм поиска»? Но для начинающих, возможно, вы делаете.
В заключение, я сильно сомневаюсь, что есть один универсальный инструмент, который поможет вам. Но у вас наверняка есть все варианты под рукой, и что-то специфическое для потребности может быть закодировано без особых усилий.