Как я могу получить заголовок и сценарии внутри веб-страницы, используя webkit + gtk? - PullRequest
1 голос
/ 28 октября 2010


Вот мой фрагмент кода

import gtk, webkit
window = gtk.Window()
browser = webkit.WebView()
url = "www.google.com"
browser.open(url)

Теперь я хочу получить заголовок веб-страницы, теги скрипта внутри. Так как я могу это сделать?

Документация не ясна в этих точках, и я нашел документацию только для Objective-C, и я пытаюсь найти свой путь там. Пожалуйста, если вы знаете, где я могу получить лучшую ссылку не обязательно для Python. C, C ++ тоже подойдет.

Спасибо

Ответы [ 2 ]

1 голос
/ 28 октября 2010

Я думаю, что следующее должно работать (я не могу попробовать это прямо сейчас):

def title_changed(widget, frame, title):
    print title

browser.connect('title-changed', title_changed)

Есть некоторая документация здесь и здесь идва примера в каталоге demo из исходного архива.

0 голосов
/ 28 октября 2010

Это не связано с технологией, используемой для получения HTML.Как только браузер откроет его, просто разберите HTML с красивым супом или чем-нибудь, что поддерживает XPath, например.

...