По сути, они составляют большой список веб-сайтов, используя связи (ссылки) между ними. Чем больше сайтов знает ваша поисковая система, тем лучше. Единственная проблема здесь - возможность сделать этот список полезным. То есть большой список возможностей веб-сайта не означает хороший набор результатов поиска, поэтому вы должны быть в состоянии сказать, что важно на каждой веб-странице.
Но в соответствии с имеющимися у вас возможностями обработки информации вам не нужно останавливаться на достигнутом.
Это не гарантирует, что вы попадете на каждый URL, но это практически единственный практический способ сканирования в Интернете.