C: как читать веб-страницу - PullRequest
       13

C: как читать веб-страницу

2 голосов
/ 15 августа 2011

Я пытаюсь открыть соединение с веб-страницей (например, www.google.com) через localhost, порт 80.

Как я могу сделать это программно в C?Я хочу получить все заголовки HTML, а не только содержимое; (

Я надеюсь, что кто-то может помочь.

Заранее большое спасибо,

Ответы [ 3 ]

4 голосов
/ 15 августа 2011

Вот пример кода о том, как сделать это с libcurl:

http://curl.haxx.se/libcurl/c/getinmemory.html

Вот еще один, который показывает вам, как получить некоторые данные заголовка:

http://curl.haxx.se/libcurl/c/getinfo.html

Эти и многие другие примеры доступны в составе libcurl. Это должно больше, чем начать.

2 голосов
/ 15 августа 2011

Обобщенный процесс:

  • Разрешение DNS для имени хоста (с использованием getaddrinfo())
  • Открыть потоковый сокет (TCP) для разрешенного IP-адреса и порта
  • Отправить запрос GET (см. Протокол в: http://en.wikipedia.org/wiki/Hypertext_Transfer_Protocol)

    GET /index.html HTTP / 1.1 Ведущий: www.example.com

  • Чтение заголовков - Завершено \ r \ n \ r \ n

  • Чтение тела
  • Закрыть розетку
0 голосов

Пример минимального запуска POSIX

В этом ответе я приведу минимальный работоспособный пример POSIX C: Как сделать HTTP-запрос на получение в C без libcurl?

Это позволяет делать:

./wget example.com

для загрузки http://example.com

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...