Очистить TCP-буфер ядра для пакетов, помеченных MSG_MORE - PullRequest
6 голосов
/ 30 марта 2010

Страница * руководства пользователя показывает флаг MSG_MORE, который действует как TCP_CORK. У меня есть функция оболочки около send():

int SocketConnection_Write(SocketConnection *this, void *buf, int len) {
    errno = 0;

    int sent = send(this->fd, buf, len, MSG_NOSIGNAL);

    if (errno == EPIPE || errno == ENOTCONN) {
        throw(exc, &SocketConnection_NotConnectedException);
    } else if (errno == ECONNRESET) {
        throw(exc, &SocketConnection_ConnectionResetException);
    } else if (sent != len) {
        throw(exc, &SocketConnection_LengthMismatchException);
    }

    return sent;
}

Предполагая, что я хочу использовать буфер ядра, я мог бы пойти с TCP_CORK, включить всякий раз, когда это необходимо, а затем отключить его, чтобы очистить буфер. Но с другой стороны, тем самым возникает необходимость в дополнительном системном вызове. Таким образом, использование MSG_MORE кажется мне более подходящим. Я бы просто изменил приведенную выше строку send () на:

int sent = send(this->fd, buf, len, MSG_NOSIGNAL | MSG_MORE);

Согласно lwm.net , пакеты будут автоматически сбрасываться, если они достаточно велики:

Если приложение устанавливает этот параметр на сокет ядро ​​не отправит короткие пакеты. Вместо этого он будет ждать пока не появилось достаточно данных для заполнения пакет максимального размера, затем отправьте его. Когда TCP_CORK выключен, любой остальные данные будут выходить на провод.

Но этот раздел относится только к TCP_CORK. Теперь, как правильно очищать MSG_MORE пакеты?

Я могу думать только о двух возможностях:

  1. Вызовите send () с пустым буфером и без установки MSG_MORE
  2. Повторно применить параметр TCP_CORK, как описано на этой странице

К сожалению, вся тема очень плохо документирована, и я не смог найти много в Интернете.

Мне также интересно, как проверить, что все работает, как ожидалось? Очевидно, что запуск сервера через strace не вариант. Таким образом, самый простой способ - использовать netcat, а затем посмотреть на вывод strace? Или ядро ​​будет обрабатывать трафик, передаваемый через интерфейс обратной связи, по-другому?

Ответы [ 2 ]

11 голосов
/ 31 марта 2010

Я взглянул на исходный код ядра, и оба предположения оказались верными. Следующий код является выдержкой из net/ipv4/tcp.c (2.6.33.1).

static inline void tcp_push(struct sock *sk, int flags, int mss_now,
                int nonagle)
{
    struct tcp_sock *tp = tcp_sk(sk);

    if (tcp_send_head(sk)) {
        struct sk_buff *skb = tcp_write_queue_tail(sk);
        if (!(flags & MSG_MORE) || forced_push(tp))
            tcp_mark_push(tp, skb);
        tcp_mark_urg(tp, flags, skb);
        __tcp_push_pending_frames(sk, mss_now,
                      (flags & MSG_MORE) ? TCP_NAGLE_CORK : nonagle);
    }
}

Следовательно, если флаг не установлен, ожидающие кадры обязательно будут сброшены. Но это будет только в том случае, когда буфер не пустой :

static ssize_t do_tcp_sendpages(struct sock *sk, struct page **pages, int poffset,
             size_t psize, int flags)
{
(...)
    ssize_t copied;
(...)
    copied = 0;

    while (psize > 0) {
(...)
        if (forced_push(tp)) {
            tcp_mark_push(tp, skb);
            __tcp_push_pending_frames(sk, mss_now, TCP_NAGLE_PUSH);
        } else if (skb == tcp_send_head(sk))
            tcp_push_one(sk, mss_now);
        continue;

wait_for_sndbuf:
        set_bit(SOCK_NOSPACE, &sk->sk_socket->flags);
wait_for_memory:
        if (copied)
            tcp_push(sk, flags & ~MSG_MORE, mss_now, TCP_NAGLE_PUSH);

        if ((err = sk_stream_wait_memory(sk, &timeo)) != 0)
            goto do_error;

        mss_now = tcp_send_mss(sk, &size_goal, flags);
    }

out:
    if (copied)
        tcp_push(sk, flags, mss_now, tp->nonagle);
    return copied;

do_error:
    if (copied)
        goto out;
out_err:
    return sk_stream_error(sk, flags, err);
}

Тело цикла while никогда не будет выполнено, потому что psize не больше 0. Тогда в разделе out есть еще один шанс, вызывается tcp_push(), но из-за того, что copied по-прежнему имеет значение по умолчанию значение, оно также потерпит неудачу.

Таким образом, отправка пакета длиной 0 никогда не приведет к сбросу.

Следующая теория должна была повторно применить TCP_CORK. Давайте сначала посмотрим на код:

static int do_tcp_setsockopt(struct sock *sk, int level,
        int optname, char __user *optval, unsigned int optlen)
{

(...)

    switch (optname) {
(...)

    case TCP_NODELAY:
        if (val) {
            /* TCP_NODELAY is weaker than TCP_CORK, so that
             * this option on corked socket is remembered, but
             * it is not activated until cork is cleared.
             *
             * However, when TCP_NODELAY is set we make
             * an explicit push, which overrides even TCP_CORK
             * for currently queued segments.
             */
            tp->nonagle |= TCP_NAGLE_OFF|TCP_NAGLE_PUSH;
            tcp_push_pending_frames(sk);
        } else {
            tp->nonagle &= ~TCP_NAGLE_OFF;
        }
        break;

    case TCP_CORK:
        /* When set indicates to always queue non-full frames.
         * Later the user clears this option and we transmit
         * any pending partial frames in the queue.  This is
         * meant to be used alongside sendfile() to get properly
         * filled frames when the user (for example) must write
         * out headers with a write() call first and then use
         * sendfile to send out the data parts.
         *
         * TCP_CORK can be set together with TCP_NODELAY and it is
         * stronger than TCP_NODELAY.
         */
        if (val) {
            tp->nonagle |= TCP_NAGLE_CORK;
        } else {
            tp->nonagle &= ~TCP_NAGLE_CORK;
            if (tp->nonagle&TCP_NAGLE_OFF)
                tp->nonagle |= TCP_NAGLE_PUSH;
            tcp_push_pending_frames(sk);
        }
        break;
(...)

Как видите, есть два способа сброса. Вы можете установить TCP_NODELAY на 1 или TCP_CORK на 0. К счастью, оба не будут проверять, установлен ли флаг. Таким образом, мой первоначальный план по повторному применению флага TCP_CORK можно оптимизировать, чтобы просто отключить его, даже если он в данный момент не установлен.

Надеюсь, это поможет кому-то с похожими проблемами.

3 голосов
/ 24 августа 2011

Это много исследований ... все, что я могу предложить, это эмпирическая заметка:

При отправке пакета с установленным MSG_MORE, за которым следует пакет без MSG_MORE, вся партия уходит. Это работает удовольствие для чего-то вроде этого:

  for (i=0; i<mg_live.length; i++) {
        // [...]
        if ((n = pth_send(sock, query, len, MSG_MORE | MSG_NOSIGNAL)) < len) {
           printf("error writing to socket (sent %i bytes of %i)\n", n, len);
           exit(1);
        }
     }
  }

  pth_send(sock, "END\n", 4, MSG_NOSIGNAL);

То есть, когда вы отправляете все пакеты одновременно и имеете четко определенный конец ... И вы используете только один сокет.

Если вы попытались выполнить запись в другой сокет в середине вышеуказанного цикла, вы можете обнаружить, что Linux освобождает ранее удерживаемые пакеты. По крайней мере, похоже, это проблема, с которой я сейчас сталкиваюсь. Но это может быть простым решением для вас.

...