Контроль приложений при ретрансляции TCP в Linux - PullRequest
28 голосов
/ 06 мая 2011

Для нетерпеливых:

Как изменить значение /proc/sys/net/ipv4/tcp_retries2 для одного подключения в Linux, используя setsockopt(), ioctl() или подобное, или это возможно?

Более длинное описание:

Я занимаюсь разработкой приложения, которое использует длинные запросы HTTP-запроса.На стороне сервера необходимо знать, когда клиент закрыл соединение.Точность не критична, но она не может быть 15 минут.Ближе к минуте все будет в порядке.

Для тех, кто не знаком с этой концепцией, длинный HTTP-запрос на опрос работает так:

  • Клиент отправляет запрос
  • Сервер отвечает HTTP-заголовками, но оставляет ответ открытым.Используется кодирование передачи по частям, позволяющее серверу отправлять биты данных, когда они становятся доступными.
  • Когда все данные отправляются, сервер отправляет «закрывающий фрагмент», чтобы сообщить о завершении ответа.

В моем приложении сервер посылает «пульс» клиенту время от времени (по умолчанию 30 секунд).Сердцебиение - это просто символ новой строки, который отправляется как блок ответа.Это означает, что линия должна быть занята, чтобы мы сообщали о потере соединения.

Нет проблем, когда клиент правильно выключается.Но когда он принудительно выключается (например, клиентский компьютер теряет питание), сброс TCP не отправляется.В этом случае сервер отправляет сердцебиение, которое клиент не подтверждает.После этого сервер продолжает повторную передачу пакета в течение примерно 15 минут после отказа и сообщения о сбое на прикладной уровень (наш HTTP-сервер).И 15 минут - это слишком долго в моем случае.

Я могу контролировать время повторной передачи, записав следующие файлы в /proc/sys/net/ipv4/:

tcp_retries1 - INTEGER
    This value influences the time, after which TCP decides, that
    something is wrong due to unacknowledged RTO retransmissions,
    and reports this suspicion to the network layer.
    See tcp_retries2 for more details.

    RFC 1122 recommends at least 3 retransmissions, which is the
    default.

tcp_retries2 - INTEGER
    This value influences the timeout of an alive TCP connection,
    when RTO retransmissions remain unacknowledged.
    Given a value of N, a hypothetical TCP connection following
    exponential backoff with an initial RTO of TCP_RTO_MIN would
    retransmit N times before killing the connection at the (N+1)th RTO.

    The default value of 15 yields a hypothetical timeout of 924.6
    seconds and is a lower bound for the effective timeout.
    TCP will effectively time out at the first RTO which exceeds the
    hypothetical timeout.

    RFC 1122 recommends at least 100 seconds for the timeout,
    which corresponds to a value of at least 8.

Значение по умолчанию tcp_retries2 действительно 8, и мой опыт 15 минут (900 секунд) повторной передачи соответствует приведенной выше документации ядра.

Если я, например, изменю значение tcp_retries2 на 5, соединение прекратитсянамного быстрееНо его установка влияет на все соединения в системе, и я бы очень хотел установить его только для этого длинного опрашивающего соединения.

Цитата из RFC 1122:

4.2.3.5  TCP Connection Failures

   Excessive retransmission of the same segment by TCP
   indicates some failure of the remote host or the Internet
   path.  This failure may be of short or long duration.  The
   following procedure MUST be used to handle excessive
   retransmissions of data segments [IP:11]:

   (a)  There are two thresholds R1 and R2 measuring the amount
        of retransmission that has occurred for the same
        segment.  R1 and R2 might be measured in time units or
        as a count of retransmissions.

   (b)  When the number of transmissions of the same segment
        reaches or exceeds threshold R1, pass negative advice
        (see Section 3.3.1.4) to the IP layer, to trigger
        dead-gateway diagnosis.

   (c)  When the number of transmissions of the same segment
        reaches a threshold R2 greater than R1, close the
        connection.

   (d)  An application MUST be able to set the value for R2 for
        a particular connection.  For example, an interactive
        application might set R2 to "infinity," giving the user
        control over when to disconnect.

   (e)  TCP SHOULD inform the application of the delivery
        problem (unless such information has been disabled by
        the application; see Section 4.2.4.1), when R1 is
        reached and before R2.  This will allow a remote login
        (User Telnet) application program to inform the user,
        for example.

Мне кажется, что tcp_retries1 и tcp_retries2 в Linux соответствуют R1 и R2 в RFC.RFC четко заявляет (в пункте d), что соответствующая реализация ДОЛЖНА позволять устанавливать значение R2, но я не нашел способа сделать это, используя setsockopt(), ioctl() или подобное.

Другойопция будет заключаться в получении уведомления при превышении R1 (элемент е).Это не так хорошо, как установка R2, хотя, как я думаю, R1 будет нажата довольно скоро (через несколько секунд), и значение R1 не может быть установлено для каждого соединения, или, по крайней мере, RFC не 'это не требуется.

Ответы [ 5 ]

24 голосов
/ 06 мая 2011

Похоже, это было добавлено в ядро ​​2.6.37. Зафиксируйте diff из ядра Git и Excerpt из журнала изменений ниже;

совершить dca43c75e7e545694a9dd6288553f55c53e2a3a3 Автор: Джерри Чу Дата: пт 27 августа 19:13:28 2010 + 0000

tcp: Add TCP_USER_TIMEOUT socket option.

This patch provides a "user timeout" support as described in RFC793. The
socket option is also needed for the the local half of RFC5482 "TCP User
Timeout Option".

TCP_USER_TIMEOUT is a TCP level socket option that takes an unsigned int,
when > 0, to specify the maximum amount of time in ms that transmitted
data may remain unacknowledged before TCP will forcefully close the
corresponding connection and return ETIMEDOUT to the application. If 
0 is given, TCP will continue to use the system default.

Increasing the user timeouts allows a TCP connection to survive extended
periods without end-to-end connectivity. Decreasing the user timeouts
allows applications to "fail fast" if so desired. Otherwise it may take
upto 20 minutes with the current system defaults in a normal WAN
environment.

The socket option can be made during any state of a TCP connection, but
is only effective during the synchronized states of a connection
(ESTABLISHED, FIN-WAIT-1, FIN-WAIT-2, CLOSE-WAIT, CLOSING, or LAST-ACK).
Moreover, when used with the TCP keepalive (SO_KEEPALIVE) option,
TCP_USER_TIMEOUT will overtake keepalive to determine when to close a
connection due to keepalive failure.

The option does not change in anyway when TCP retransmits a packet, nor
when a keepalive probe will be sent.

This option, like many others, will be inherited by an acceptor from its
listener.

Signed-off-by: H.K. Jerry Chu <hkchu@google.com>
Signed-off-by: David S. Miller <davem@davemloft.net>
13 голосов
/ 06 мая 2011

Я полагаю, что если доступна опция сокета TCP_USER_TIMEOUT, описанная Kimvais , используйте ее. В старых ядрах, где эта опция сокета отсутствует, вы могли бы неоднократно вызывать SIOCOUTQ ioctl(), чтобы определить размер очереди отправки сокета - если очередь отправки не уменьшается в течение периода ожидания, это указывает на отсутствие ACK были получены, и вы можете закрыть сокет.

3 голосов
/ 06 мая 2011

Подумав (и погуглив), я пришел к выводу, что вы не можете изменить значение tcp_retries1 и tcp_retries2 для одного сокета, если не примените какой-либо патч к ядру.Это возможно для вас?

В противном случае, вы можете использовать опцию сокета TCP_KEEPALIVE, целью которой является проверка того, что соединение все еще активно (мне кажется, это именно то, что вы пытаетесь достичь, поэтомуимеет смысл).Обратите внимание на то, что вам нужно немного подправить параметр по умолчанию, потому что по умолчанию отключение происходит примерно через 2 часа !!!

0 голосов
/ 19 января 2016
int name[] = {CTL_NET, NET_IPV4, NET_IPV4_TCP_RETRIES2};
long value = 0;
size_t size = sizeof(value);
if(!sysctl(name, sizeof(name)/sizeof(name[0]), &value, &size, NULL, 0) {
  value // It contains current value from /proc/sys/net/ipv4/tcp_retries2
}
value = ... // Change value if it needed
if(!sysctl(name, sizeof(name)/sizeof(name[0]), NULL, NULL, &value, size) {
  // Value in /proc/sys/net/ipv4/tcp_retries2 changed successfully
}

Программным способом используется C. Это работает по крайней мере на Ubuntu.Но (согласно коду и системным переменным) похоже, что это влияет на все TCP-соединения в системе, а не только на одно единственное соединение.

0 голосов
/ 22 апреля 2015

Это для моего понимания. tcp_retries2 - это число повторных передач, которое разрешено системой перед удалением соединения. Так что, если мы хотим изменить значение по умолчанию для tcp_retries2, используя TCP_USER_TIMEOUT, который определяет максимальный объем времени, в течение которого передаваемые данные могут оставаться неподтвержденными, мы должны увеличить значение TCP_USER_TIMEOUT верно?

В этом случае соединение будет ждать дольше и не будет повторно передавать пакет данных. Пожалуйста, поправьте меня, если что-то не так.

...