Я пишу веб-скребок, который собирает материалы из десятилетних статей из Википедии.(например, статьи о 10s , 1970-х , 1670-х до н.э. и т. д.)
Я использую логику, которая похожа на этучтобы захватить страницы.
for (i = -1690; i <= 2010; i += 10)
if (i < 0)
page = (-i) + "s_BC"
else
page = i + "s"
GrabContentFromURL("http://en.wikipedia.org/wiki/" + page)
Это работает, за исключением одной маленькой детали, которую я не учел.
Проблема в том, что существует два десятилетия.Существует 0 с н.э. и 0 с н.э. .При том, как в настоящее время работает мой цикл, программа получает только содержимое со страницы 0s AD.
Это довольно простая проблема, но мне трудно найти очень хороший способ ее исправить.Это.Я знаю, что могу извлечь тело цикла в отдельную функцию и использовать два отдельных цикла, но я чувствую, что есть более элегантный способ сделать это, которого мне не хватает.
Как я могу исправить эту проблемубез излишней сложности?