Question

У меня появился новый интерес к созданию небольшого, эффективного веб-сервера на C, и у меня возникли некоторые проблемы при синтаксическом анализе методов POST из заголовка HTTP. Кто-нибудь посоветует, как справиться с извлечением пар имя / значение из «опубликованных» данных?

POST /test HTTP/1.1
Host: test-domain.com:7017
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.1) Gecko/2008070208 Firefox/3.0.1
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: en-us,en;q=0.5
Accept-Encoding: gzip,deflate
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7
Keep-Alive: 300
Connection: keep-alive
Referer: http://test-domain.com:7017/index.html
Cookie: __utma=43166241.217413299.1220726314.1221171690.1221200181.16; __utmz=43166241.1220726314.1.1.utmccn=(direct)|utmcsr=(direct)|utmcmd=(none)
Cache-Control: max-age=0
Content-Type: application/x-www-form-urlencoded
Content-Length: 25

field1=asfd&field2=a3f3f3
// ^-this

Я не вижу ощутимого способа восстановить итоговую строку в целом и убедиться, что она работает каждый раз. Я не фанат жёсткого программирования во всем.

Brian R. Bondy · Answer 1 · 17 сентября 2008

Вы можете получить пары имя / значение, выполнив поиск новой строки или, более конкретно, \ r \ n \ r \ n (после этого начнется текст сообщения).

Затем вы можете просто разделить список на &, а затем разделить каждую из этих возвращаемых строк между парами = для имени / значения.

См. HTTP 1.1 RFC .

Miguel A. Friginal · Answer 2 · 22 декабря 2008

Как только у вас есть Content-Length в заголовке, вы знаете количество байтов, которое нужно прочитать сразу после пустой строки. Если по какой-либо причине (GET или POST) Content-Length отсутствует в заголовке, это означает, что после пустой строки (crlf) читать нечего.

jfm3 · Answer 3 · 17 сентября 2008

Вы должны продолжать анализировать поток как заголовки, пока не увидите пустую строку. Остальные данные POST.

Вам нужно написать небольшой парсер для данных поста. Вы можете использовать подпрограммы библиотеки C, чтобы сделать что-то быстрое и грязное, например index, strtok и sscanf. Если у вас есть место для этого в вашем определении «small», вы можете сделать что-то более сложное с библиотекой регулярных выражений или даже с flex и bison.

По крайней мере, я думаю, что такой ответ на ваш вопрос.

Oliver · Answer 4 · 23 ноября 2017

Несмотря на это, IETF RFC дает более точный ответ. Предполагая, что вы понимаете, что после строки Content-Length в заголовке всегда есть лишние /r/n, вы сможете выполнить эту работу, чтобы выделить ее в char* переменную с именем data. Это то место, с которого мы начинаем.

char *data = "f1=asfd&f2=a3f3f3";
char f1[100], 
char f2[100];
sscanf(data, "%s&%s", &f1, &f2); // get the field tuples

char f1_name[50];
char f1_data[50];
sscanf(f1, "%s=%s", f1_name, f1_data);  

char f2_name[50];
char f2_data[50];
sscanf(f2, "%s=%s", f2_name, f2_data);

Разбор HTTP-заголовков

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Разбор HTTP-заголовков

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов