Я новичок здесь и совершенно новичок в веб-разработке в целом. Я занимаюсь 3D-моделированием и дизайном, но недавно я начал проект, который, я думаю, мог бы стать хорошим ресурсом для 3D-сообщества.
У меня есть страница, в основном разработанная и закодированная здесь: The Top Row , но я почти закончила свои знания. Верхний и нижний разделы (в центре внимания художника) будут обновляться вручную, поэтому я не беспокоюсь об этом.
Часть, с которой у меня проблемы, - это средняя часть под заголовком «Лучший из остальных». То, что я хочу сделать, это очистить изображения (и ссылки) с семи известных форумов компьютерной графики и отобразить их в областях контента, которые я выложил. Каждый из форумов имеет раздел в верхней части своей страницы, который отображает пять или шесть избранных изображений.
Если вы посмотрите на CGSociety , например: у них есть верхний ряд с шестью показанными фигурами. Я хочу взять три новейших и отобразить их в моем окне контента CGSociety со ссылками на оригинальные темы . Важно, чтобы я тоже получал ссылки, так как весь смысл сайта в том, чтобы привлечь внимание художников, которые этого заслуживают.
Изображения всегда находятся в одинаковых местах и всегда имеют предсказуемый путь вплоть до имени изображения:
т.е.: http://features.cgsociety.org/cgtalk/plugs/"featured image".jpg
Я не знаю, уместно ли это, но xpath для изображений также надежен. Для CGSociety изображение в основном определяется числом, содержащимся в окончательном наборе скобок.
/x:html/x:body/x:div[4]/x:div/x:div/x:table[1]/x:tbody/x:tr/x:td[1]/x:a/x:img
Я прочитал так много разных потоков переполнения стека, но многое из этого происходит у меня над головой. У меня нет большого опыта программирования, но я подозреваю, что то, что я пытаюсь сделать, не так уж сложно.
Итак, вот мои основные вопросы:
Какой самый лучший (самый простой) метод для этого вида очистки? Я продолжаю видеть Python с упоминанием Beautiful Soup или lxml, но кто-то еще рекомендовал PHP с cURL и xPath.
Существует ли какой-либо конкретный метод, который будет оказывать наименьшую нагрузку на форумы-источники? Все эти форумы имеют членство в десятках (или сотнях) тысяч, так что это, вероятно, не очень большая проблема, но я бы хотел сделать это без прямой горячей ссылки, если это возможно.
Я даже направляюсь в правильном направлении?
Также : Я знаю, что соскоб является законной серой зоной. Я планирую запросить разрешение у каждого из участвующих форумов, но мне нужна рабочая модель, чтобы показывать их, когда я спрашиваю.
Любая помощь будет очень, очень признательна. Я думаю, это мог бы быть классный сайт, если я смогу заставить его работать.