У меня есть модульный тест, который проверяет поведение блокирующих и неблокирующих сокетов - сервер пишет длинный ответ, и в какой-то момент он больше не может писать, и он
блоки на запись.
В основном одна сторона пишет, а другая не читает.
В Solaris в какой-то момент я получаю ошибку "Недостаточно места" (после записи 75 МБ) вместо блокировки при записи:
Программа, которая воспроизводит проблему:
#include <sys/types.h>
#include <sys/socket.h>
#include <sys/wait.h>
#include <unistd.h>
#include <stdlib.h>
#include <stdio.h>
#include <errno.h>
#include <string.h>
#include <signal.h>
#include <arpa/inet.h>
#include <sys/socket.h>
#include <sys/un.h>
#include <netinet/in.h>
char const *address = "127.0.0.1";
#define check(x) do { if( (x) < 0) { perror(#x) ; exit(1); } } while(0)
int main()
{
signal(SIGPIPE,SIG_IGN);
struct sockaddr_in inaddr = {};
inaddr.sin_family = AF_INET;
inaddr.sin_addr.s_addr = inet_addr(address);
inaddr.sin_port = htons(8080);
int res = fork();
if(res < 0) {
perror("fork");
exit(1);
}
if(res > 0) {
int fd = -1;
int status;
sleep(1);
check(fd = socket(AF_INET,SOCK_STREAM,0));
check(connect(fd,(sockaddr*)&inaddr,sizeof(inaddr)));
sleep(5);
close(fd);
wait(&status);
return 0;
}
else {
int acc,fd;
check(acc = socket(AF_INET,SOCK_STREAM,0));
int yes = 1;
check(setsockopt(acc,SOL_SOCKET,SO_REUSEADDR,&yes,sizeof(yes)));
check(bind(acc,(sockaddr*)&inaddr,sizeof(inaddr)));
check(listen(acc,10));
check(fd = accept(acc,0,0));
char buf[1000];
long long total= 0;
do {
int r = send(fd,buf,sizeof(buf),0);
if(r < 0) {
printf("write %s\n",strerror(errno));
return 0;
}
else if(r==0) {
printf("Got eof\n");
return 0;
}
total += r;
if(total > 1001024) {
printf("Too much!!!!\n");
return 0;
}
printf("%lld\n",total);
}while(1);
}
return 0;
}
Вывод на Solaris (две последние строки)
75768000
write Not enough space
Ожидаемый вывод в Linux (две последние строки)
271760
write Connection reset by peer
Что происходит, только когда другая сторона закрывает сокет.
Есть идеи, почему и как я могу это исправить, какие опции установить?
П.С .: Это OpenSolaris 2009.06, x86
редактирует *1024*
- Добавлен полный код C, который воспроизводит проблему
Ответ:
Это похоже на ошибку в конкретной версии ядра Solaris, библиотеки libc.