Сканер не знает. Но он никогда не узнает даже о сайтах, которые возвращают обычный старый HTML - очень легко написать код, который скрывает сайт на основе заголовков http, используемых сканерами или известных заголовков IP.
См. Этот связанный вопрос: Как Google знает, что вы маскируете?
В большинстве случаев это похоже на гипотезу, но, скорее всего, существуют различные проверки на месте, варьирующиеся от подмены обычных заголовков браузера и реальных реальных людей, просматривающих страницу.
Продолжая эту гипотезу, программисты в Google, конечно же, не могли бы написать форму искателя, который фактически извлекал бы то, что видит пользователь - в конце концов, у них есть собственный браузер, который делает именно это. Это было бы непомерно дорого для процессора, чтобы делать это все время, но, вероятно, имеет смысл для случайной выборочной проверки.