Я пишу паука на Python, чтобы сканировать сайт. Проблема в том, что мне нужно изучить около 2,5 миллионов страниц, поэтому я действительно могу использовать некоторую помощь, чтобы оптимизировать ее для скорости.
Что мне нужно сделать, так это изучить страницы на предмет определенного числа и, если он найден, записать ссылку на страницу. Паук очень прост, ему просто нужно перебрать много страниц.
Я совершенно новичок в Python, но раньше использовал Java и C ++. Я еще не начал его кодировать, поэтому любые рекомендации по библиотекам или фреймворкам были бы полезны. Любые советы по оптимизации также приветствуются.