Ошибка разрешения DNS для www.docusign.net (западная часть США) - PullRequest
0 голосов
/ 04 октября 2018

Мы выполняем вызовы API для Docusign, которые иногда завершаются с ошибками «getaddrinfo: Имя или служба не известна».Исследуя далее, мы видим, что когда мы подключаемся, разрешение имен иногда не удается, но только из нашего западного центра обработки данных.Похоже, что GLB DNS для США Запад может занять очень много времени, что приводит к превышению времени ожидания клиента DNS, если поиск адреса занимает более 10 секунд.

$ dig @1.1.1.1 www.docusign.net

; <<>> DiG 9.9.5-3ubuntu0.8-Ubuntu <<>> @1.1.1.1 www.docusign.net
; (1 server found)
;; global options: +cmd
;; Got answer:
;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 49468
;; flags: qr rd ra; QUERY: 1, ANSWER: 3, AUTHORITY: 0, ADDITIONAL: 1

;; OPT PSEUDOSECTION:
; EDNS: version: 0, flags:; udp: 1452
;; QUESTION SECTION:
;www.docusign.net.              IN      A

;; ANSWER SECTION:
www.docusign.net.       22      IN      CNAME   www-geo.docusign.net.akadns.net.
www-geo.docusign.net.akadns.net. 22 IN  CNAME   www-west.docusign.net.akadns.net.
www-west.docusign.net.akadns.net. 22 IN A       162.248.184.27

;; Query time: 1 msec
;; SERVER: 1.1.1.1#53(1.1.1.1)
;; WHEN: Thu Oct 04 13:16:43 EDT 2018
;; MSG SIZE  rcvd: 126

Выше приведен хороший результат, который занял 1 мс(кэшировано)

$ dig @1.1.1.1 www.docusign.net

; <<>> DiG 9.9.5-3ubuntu0.8-Ubuntu <<>> @1.1.1.1 www.docusign.net
; (1 server found)
;; global options: +cmd
;; Got answer:
;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 21193
;; flags: qr rd ra; QUERY: 1, ANSWER: 3, AUTHORITY: 0, ADDITIONAL: 1

;; OPT PSEUDOSECTION:
; EDNS: version: 0, flags:; udp: 1452
;; QUESTION SECTION:
;www.docusign.net.              IN      A

;; ANSWER SECTION:
www.docusign.net.       6       IN      CNAME   www-geo.docusign.net.akadns.net.
www-geo.docusign.net.akadns.net. 6 IN   CNAME   www-west.docusign.net.akadns.net.
www-west.docusign.net.akadns.net. 6 IN  A       162.248.184.27

;; Query time: 2725 msec
;; SERVER: 1.1.1.1#53(1.1.1.1)
;; WHEN: Thu Oct 04 13:21:29 EDT 2018
;; MSG SIZE  rcvd: 126

Это хуже, так как прошло почти 3 секунды.Во время тестирования мы наблюдали, как этот показатель превышает 12 секунд, что приводит к превышению времени ожидания многих DNS-клиентов и запросов приложений.

Поскольку TTL установлен на 30 с, это означает, что каждые 30 секунд у нас есть шанс получить тайм-аут, наше приложение генерирует ошибки, а затем успех DNS приводит к возобновлению обслуживания.К сожалению, это выглядит как ошибка для наших клиентов в нашем приложении.

Мы можем обойти это, используя хаки, но мне любопытно, если кто-то еще видит это, и как вы обходили это,Кроме того, для пользователей docusign / akamai было бы полезно выяснить, почему производительность записи www-west.docusign.net.akadns.net настолько плоха.

...