Вам нужно расширить базу данных и обработку, чтобы лучше справиться с проблемой.
Данные, предоставленные удаленной службой, имеют другой формат, как вы уже отметили.Таким образом, вам необходимо разделить задачи извлечения и анализа данных, потому что обе вещи независимы друг от друга.Например, формат для одного TLD может меняться с течением времени .
Итак, прежде всего вы выбираете данные в виде простого текста для каждого домена и сохраняете их метаданные:
- домен
- whois-сервер
- метка времени операции выборки
- ответ
- код состояния (если таковой имеется в протоколе)
Затем вы можете позже в течение второй обработки выполнить анализ.Вы можете использовать уже существующие метаданные, чтобы решить, какой алгоритм разбора вам нужен.Это также поможет вам поддерживать ваше приложение с течением времени .
После правильного анализа вы получите нормализованный формат, к которому вы стремитесь.
Далеек этим техническим процессам вы должны позаботиться об условиях использования, предлагаемых службой (-ами) whois.Не все, что технически возможно, юридически или морально принято.Заботьтесь и относитесь к личным записям других лиц с уважением, которого они заслуживают.Защитите данные, которые вы собираете, например, архивируйте и скремблируйте / блокируйте данные, которые вам больше не нужны для дальнейшей обработки.
См. Также: