Проблема проверки Google CAPTCHA - PullRequest
0 голосов
/ 31 мая 2011

Я работаю над проектом, для которого мне нужно извлечь некоторые данные из Google Scholar.Моя PHP-программа берет строку с моего локального компьютера, передает ее в Google Scholar и на странице результатов поиска вынимает первый результат и сохраняет его в базе данных.

Я должен сделать это почти на 90тысяча строк / запросов.Проблема в том, что после нескольких сотен записей программа останавливается, так как Google Scholar запрашивает проверку кода.Что я могу с этим поделать?

1 Ответ

2 голосов
/ 31 мая 2011

Поскольку у Google Scholar нет API, нет задокументированного способа сделать то, что вы хотите.Вы не должны собирать данные подобным образом, поэтому вы используете функции защиты от ботов Google.Я думаю, что ваш единственный реальный вариант - подождать, пока Google создаст API.

...