Я работаю над созданием crawler - веб-приложения на java, в котором пользователи могут определять задания на сканирование, которые извлекают и хранят информацию с определенных веб-сайтов.
Как часть этой работы, существует конструкция 'loop' ... она имеет часть списка, которая первоначально оценивается (и обычно представляет собой список значений) ... После этого идет тело цикла, которое выполняется один раз для каждого элемента в списке (из части списка, упомянутой ранее).
Обратите внимание, что внутри другой конструкции цикла может быть конструкция цикла и т. Д.
Проблема в том, что иногда один список может содержать миллионы строк данных - и тело должно быть выполнено для каждой строки в этом списке. Тело имеет начальное значение индекса, верхнюю границу индекса и увеличивается на единицу.
Что я хочу сделать, так это для одноуровневого цикла сначала рассчитать значение списка и сохранить его в базе данных. После этого вместо выполнения тела за один раз разделите его на разные секции, чтобы разные секции списка обрабатывались параллельно.
Однако, как мне разделить задание на n-уровневый цикл? (Т. Е. Один цикл внутри одного цикла и т. Д.)
Есть ли какой-нибудь рекомендуемый способ выполнения такой обработки ... Любой учебник или руководство, на которое вы могли бы мне указать, было бы очень полезно для меня.