Как получить доступ к Википедии с помощью Node.js - PullRequest
0 голосов
/ 20 мая 2011

Я ищу самый простой способ интеграции Википедии в приложение node.js. Требования должны быть в состоянии искать записи и находить сущности в каждой записи.

Какие-нибудь известные существующие библиотеки / методы для этого?

Спасибо

Ответы [ 2 ]

2 голосов
/ 20 мая 2011

Существует недавно доступный парсер с открытым исходным кодом для вики-текста (http://sweble.org/), который может быть полезен вам, если вы катите свое собственное решение. Конечно, для этого потребуется загрузить дамп данных википедии, анализ и сохранение сущностей в БД .

Вы также можете посмотреть на dbpedia (http://dbpedia.org/About),, хотя для этого потребуется интегрировать стек rdf в ваше приложение (либо запустить локальный репозиторий rdf, либо связаться с часто нестабильной онлайн-версией через sparql).

Один из простых подходов - использовать API поисковой системы и ограничиться сайтом: wikipedia.org - например:

http://www.google.com/search?q=node.js+site%3Awikipedia.org

Я обнаружил, что это может работать очень хорошо.

0 голосов
/ 21 мая 2011

Паук для выскабливания с помощью jquery - это фантастика:

https://github.com/mikeal/spider

Микал - человек

Предположительно, вы бы использовали это для стороннего (личного) проекта. Не уверен, насколько кошерно драться в Википедии со скребком.

...