Получить атрибут charset мета-элемента в (X) HTML-документе с помощью xpath - PullRequest
0 голосов
/ 11 апреля 2011

Я делаю кое-что с помощью Python. Но, как вы знаете, некоторые веб-страницы имеют разные кодировки. Мне нужно получить кодировку этих веб-страниц. Короче говоря, для lxml Что такое шаблон xpath?

Спасибо.

1 Ответ

3 голосов
/ 11 апреля 2011

Это:

/html/head/meta[@http-equiv='Content-Type']/@content

HTML5:

/html/head/meta/@charset
...