Как вывести простой текст из Википедии - PullRequest
19 голосов
/ 15 декабря 2010

Я искал около 2 месяцев, чтобы найти скрипт, который получает только раздел описания Википедии. (Это для бота, которого я строю, а не для IRC.) То есть, когда я говорю

/wiki bla bla bla

он перейдет на страницу Википедии для bla bla bla, получит следующее и вернет его в чат:

"Bla Bla Bla" - это название песни сделано Джиджи д'Агостино. Он описал эта песня как "кусок, который я написал, думая из всех людей, которые говорят и говорят ничего не сказав ". выдающийся, но бессмысленный вокал образцы взяты из британской группы Песня Стретча "Почему ты это сделал"

Вот самое близкое, что я нашел, но он получает только URL:

import json
import urllib.request, urllib.parse

def google(searchfor):
  query = urllib.parse.urlencode({'q': searchfor})
  url = 'http://ajax.googleapis.com/ajax/services/search/web?v=1.0&%s' % query

  search_response = urllib.request.urlopen(url)
  search_results = search_response.read().decode("utf8")
  results = json.loads(search_results)
  data = results['responseData']
  hits = data['results']

  if len(hits) > 0:
    return hits[0]['url']
  else:
    return "No results found."

(Python 3.1)

Ответы [ 11 ]

0 голосов
/ 15 декабря 2010

Вы можете попробовать HTML-библиотеку BeautifulSoup для python, но вам придется написать простой синтаксический анализатор.

...