Сокеты Netlink и libnl - nl_recvmsgs_default возвращает -16 (EBUSY) - PullRequest
2 голосов
/ 03 декабря 2011

Я пытаюсь закодировать некоторый базовый модуль ядра - взаимодействие с программой в пространстве пользователя с использованием сокетов netlink (libnl на стороне пользователя). Программа Userspace отправляет сообщение в ядро ​​и ожидает ответа. К сожалению, не удается получить ответ с возвращаемым значением -16 (EBUSY).

Интересно, что когда я получаю данные из сокета netlink напрямую, используя стандартный системный вызов recv на nl_socket_get_fd(sock), все работает отлично!

Кто-нибудь имеет представление, почему это происходит?

Вот код пользовательского пространства (parse_cb - обратный вызов, который не вызывается):

struct nl_sock *sock;
struct nl_msg *msg;
int family, res;

// Allocate a new netlink socket
sock = nl_socket_alloc();

// Connect to generic netlink socket on kernel side
genl_connect(sock);

// Ask kernel to resolve family name to family id
family = genl_ctrl_resolve(sock, PSVFS_FAMILY_NAME);

// Construct a generic netlink by allocating a new message, fill in
// the header and append a simple integer attribute.
msg = nlmsg_alloc();
genlmsg_put(msg, NL_AUTO_PID, NL_AUTO_SEQ, family, 0, NLM_F_ECHO,
        PSVFS_C_INIT, PSVFS_VERSION);
nla_put_string(msg, PSVFS_A_MSG, "stuff");

// Send message over netlink socket
nl_send_auto_complete(sock, msg);

// Free message
nlmsg_free(msg);

nl_socket_modify_cb(sock, NL_CB_VALID, NL_CB_CUSTOM, parse_cb, NULL);

res = nl_recvmsgs_default(sock);
printf("After receive %i.\n", res);

Вот обратный вызов на стороне ядра для сообщения, отправленного программой пользователя (это вызывается правильно):

int psvfs_vfs_init(struct sk_buff *skb2, struct genl_info *info) {
    send_to_daemon("VFS initialized.", PSVFS_C_INIT, info->snd_seq+1, info->snd_pid);

    return 0;
}

А вот функция 'send_to_daemon':

int send_to_daemon(char* msg, int command, int seq, u32 pid) {
    int res = 0;
    struct sk_buff* skb;
    void* msg_head;

    skb = genlmsg_new(NLMSG_GOODSIZE, GFP_KERNEL);
    if (skb == NULL) {
        res = -ENOMEM;
        goto out;
    }

    msg_head = genlmsg_put(skb, 0, seq, &psvfs_gnl_family, 0, command);
    if (msg_head == NULL) {
        res = -ENOMEM;
        goto out;
    }

    res = nla_put_string(skb, PSVFS_A_MSG, msg);
    if (res != 0)
        goto out;

    genlmsg_end(skb, msg_head);

    res = genlmsg_unicast(&init_net, skb, pid);
    if (res != 0)
        goto out;

  out:
    return res;
}

1 Ответ

2 голосов
/ 11 декабря 2011

ОК, я обнаружил, что здесь не так.

Я наконец-то обнаружил, что функции libnl имеют свои собственные коды ошибок, отличающиеся от стандартных кодов возврата POSIX, а -16 обозначает NLE_SEQ_MISMATCH.

Проблема была вызвана неправильными порядковыми номерами, которые я присвоил своим сообщениям.

...