Согласно комментарию Пекки, большинство компаний с публичным API не разрешают использовать свои условия обслуживания, поэтому вполне возможно, что выполнение запросов 4k GET на их веб-сайт пометит вас как злонамеренного пользователя и попадет в черный список! 1001 *
Их API является RESTful и кажется простым и довольно хорошо документированным, определенно попытайтесь заставить это работать, а не идти другим путем. Хорошей первой попыткой получить ключ API было бы написание сценария UNIX для обратного поиска номера телефона. Например, предположим, что у вас есть все 4000 10-значных телефонных номеров в виде простого текстового файла, по одному на строку без форматирования, вы можете написать простой сценарий bash следующим образом:
#!/bin/bash
INPUT_FILE=phone_numbers.txt
OUTPUT_DIR=output
API_KEY='MyWhitePages.comApiKey'
BASE_URL='http://api.whitepages.com'
# Perform a reverse lookup on each phone number in the input file.
for PHONE in $(cat $INPUT_FILE); do
URL="${BASE_URL}/reverse_phone/1.0/?phone=${PHONE};api_key=${API_KEY}"
curl $URL > "${OUTPUT}/result-${PHONE}.xml"
done
После того, как вы получили все результаты, вы можете либо проанализировать XML для анализа соответствующих предприятий, либо, если вы просто заинтересованы в существовании, вы можете просто выполнить поиск каждого выходного файла для строки The search did not find results
, которая из WhitePages API .com указывает на отсутствие соответствия. Если grep преуспевает, то бизнес не существует (или изменил свой номер телефона), в противном случае он, вероятно, все еще существует (или существует другой бизнес с этим номером телефона).