Я слышал, что Google организовал (или проведет) конкурс веб-классификации, и они предоставили большой набор данных (170 тыс. Документов) веб-сайтов, которые были классифицированы по нескольким категориям (спорт, компьютеры, наука и т. Д.), Которые я пытался осмотреть. на их сайте Summer of Code с 2009 по 2011, но ничего не нашел. Кто-нибудь знает, где я могу получить этот набор данных?