Я знаю, что вы не собираетесь возвращаться на каждую страницу, но вам не нужно анализировать всю страницу, просто найдите HTML, который всегда предшествует записи.От меня только что запустил историю веб-поиска Google и сделал несколько простых поисков, если вы просматриваете страницу истории, каждая строка, которую вы искали, следует: <td style="padding:3px 0"><table id=bkmk_view_ class=noborder ><tr><td><table class="elem noborder"><tr><td class="grey" nowrap>Searched for </td><td nowrap><a title="http://www.google.com/search?q=
и сопровождается &
(амперсанд).Эта последовательность предыдущего html уникальна на странице, она возникает только при перечислении исторических поисковых терминов.
Если вы используете два термина, вы получаете знак + между терминами.Другие соглашения для различных режимов поиска, я не прошел их все.
Похоже, если вы используете метод BalusC для передачи параметров, то вы можете получить html, найти в документе строку, которую я упомянул (обязательно \ "и другие специальные символы), затем копируйте следующую строку, пока не достигнете символа &. Затем все, что вам нужно сделать, - это проанализировать поисковый запрос, а не всю страницу. Просматривайте исходный код, пока не дойдете до конца, а затем перейдите к следующей итерации в цикле.