xpath in = importXML () для извлечения метаописаний - PullRequest
3 голосов
/ 19 мая 2011

Я пытаюсь использовать Xpath для извлечения метаописаний с веб-страниц, используя Google Sheets.

У меня есть эта работа, чтобы получить названия: =importXml(www.example.com; "//title")

Вот два источника моего обучения:

http://seogadget.co.uk/playing-around-with-importxml-in-google-spreadsheets/
http://docs.google.com/support/bin/answer.py?hl=en&answer=75507

Я прочитал много других постов на этом сайте, и похоже, что это то же самое, что я хочу:

"/html/head/meta[@name='description']/@content"
"/*/head/meta[@name='description']/@content"
"//head/meta[@name=\"description\"]/@content"

Ничего из этого не работает в Google Sheets, в котором указано, что нужно писать в Xpath. Единственная разница в том, что в Google Sheets вы должны использовать «вместо» (отсюда и описание). Честно говоря, я попробовал 219 различных способов… не повезло.

Есть идеи? Заранее спасибо!

1 Ответ

3 голосов
/ 25 мая 2011
//meta[@name='description']/@content

Таким образом, ваш полный URL-вызов в листе Google будет

=importxml(A1,"//meta[@name='description']/@content")

Я создал несколько замечательных инструментов SEO, используя importXML - это только начало!:)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...