Я собираюсь начать писать программу, которая попытается извлечь данные с сайта Google Code , чтобы они могли быть импортированы на другой сайт управления проектами.В частности, мне нужно извлечь полную информацию о проблеме с сайта (описание, комментарии и т. Д.).
К сожалению, Google не предоставляет API для этого и не имеет функции экспорта, так чтоМне кажется, что единственный вариант - извлечь данные из реального HTML-кода.Есть ли у кого-нибудь какие-либо предложения относительно «наилучшей практики» при попытке анализа данных из HTML?Я знаю, что это далеко не идеально, но я не думаю, что у меня есть большой выбор.Кто-нибудь еще может подумать о лучшем способе, или, может быть, кто-то другой уже сделал это?
Кроме того, я знаю о функции экспорта CSV на странице проблемы, однако это не дает полных данных о проблемах (но может быть полезной отправной точкой).