Я предполагаю, что это потому, что этот сайт использует ajax для заполнения "бесконечного" списка прокрутки, как вы его называете.
Вы, вероятно, отправляете http-запрос и получаете начальную страницу (кстати, в моем браузере я получил 6 изображений по x 4, т.е. 24, а не 20; подумав об этом, возможно, мой клиент тоже сначала получил 20 и получил последние 4 w / ajax ...), и вам нужно будет выполнить корыто подкачки с помощью запросов ajax.
На первый взгляд, xhtml и связанный с ним javascript страницы очень плотный и несколько запутанный, потребуется некоторое время, чтобы сориентироваться ... Альтернативой анализу этой страницы является вместо этого использование анализатора пакетов (например, wireshark ) и для захвата запросов, которые происходят при прокрутке вниз.
По сути, это, вероятно, предоставит некоторую форму ajax-запроса, который вы можете затем легко эмулировать с помощью java. Обычно ответ ajax легко разбирать независимо от его природы (xml, jason, gzip ...).
Возможная ошибка в этом хорошо продуманном плане заключается в том, что возвращенные данные в ответе ajax зашифрованы, например, когда дополнительные изображения упакованы в какой-то конверт, для которого вам затем потребуется определить формат.
В зависимости от конкретной задачи, вы можете попробовать альтернативы, такие как автоматизация в GreaseMonkey (в Firefox) или аналогичные инструменты.
Как насчет Bing API?
Обратите внимание, что все вышеперечисленные подходы схожи с очисткой экрана и, следовательно, весьма чувствительны к даже незначительным изменениям в приложении Bing, и, в зависимости от эффективного использования и контекста, это может поставить проект в серую правовую зону ... Лучший подход возможно, зарегистрировать и получить правильный идентификатор приложения в MS / Bing и использовать Bing API .