Regex твой друг мой друг!Используя cat, egrep и wget, вы справитесь с этой задачей довольно быстро. Загрузите URI результатов поиска wget, затем запустите
cat DownloadedSearchResults.html | egrep (?<=class="searchResultImage".+href=").+?\.jpg/
. Это даст вам http://commons.wikimedia.org/ ссылки на каждую из веб-страниц изображения.,Теперь для каждого из этих результатов загрузите его и запустите:
cat DownloadedSearchResult.jpg | egrep (?<=class="fullImageLink".*href=").+?\.jpg
Это должно дать вам прямую ссылку на самое высокое разрешение, доступное для этого изображения.
Надеюсь, ваши знания bashсделаем все остальноеУдачи.