C ++ Библиотека URL-кода (с поддержкой Unicode)? - PullRequest
7 голосов
/ 28 августа 2010

Мне нужна библиотека, которая может URL-кодировать массив строк / символов.

Теперь я могу шестнадцатеричное кодирование массива ASCII, как здесь: http://www.codeguru.com/cpp/cpp/cpp_mfc/article.php/c4029

Но мне нужно что-то, что работает с Unicode. Примечание. В Linux И в Windows!

CURL имеет довольно хороший:

 char *encodedURL = curl_easy_escape(handle,WEBPAGE_URL, strlen(WEBPAGE_URL));

но, во-первых, для этого требуется CURL, а также он не поддерживает Unicode, как это видно на стр.

Ответы [ 2 ]

8 голосов
/ 27 августа 2011

Если я правильно прочитал квест, и вы хотите сделать это самостоятельно, без использования curl, я думаю, что у меня есть решение (sssuming UTF-8), и я думаю , что это совместимый и переносимый способ URLстроки запроса кодирования:

#include <boost/function_output_iterator.hpp>
#include <boost/bind.hpp>
#include <algorithm>
#include <sstream>
#include <iostream>
#include <iterator>
#include <iomanip>

namespace {
  std::string encimpl(std::string::value_type v) {
    if (isalnum(v))
      return std::string()+v;

    std::ostringstream enc;
    enc << '%' << std::setw(2) << std::setfill('0') << std::hex << std::uppercase << int(static_cast<unsigned char>(v));
    return enc.str();
  }
}

std::string urlencode(const std::string& url) {
  // Find the start of the query string
  const std::string::const_iterator start = std::find(url.begin(), url.end(), '?');

  // If there isn't one there's nothing to do!
  if (start == url.end())
    return url;

  // store the modified query string
  std::string qstr;

  std::transform(start+1, url.end(),
                 // Append the transform result to qstr
                 boost::make_function_output_iterator(boost::bind(static_cast<std::string& (std::string::*)(const std::string&)>(&std::string::append),&qstr,_1)),
                 encimpl);
  return std::string(url.begin(), start+1) + qstr;
}

У него нет нестандартных зависимостей, кроме boost, и если вам не нравится зависимость boost, удалить его не так сложно.

Я протестировал его, используя:

int main() {
    const char *testurls[] = {"http://foo.com/bar?abc<>de??90   210fg!\"$%",
                              "http://google.com",
                              "http://www.unicode.com/example?großpösna"};
    std::copy(testurls, &testurls[sizeof(testurls)/sizeof(*testurls)],
              std::ostream_iterator<std::string>(std::cout,"\n"));
    std::cout << "encode as: " << std::endl;
    std::transform(testurls, &testurls[sizeof(testurls)/sizeof(*testurls)],
                   std::ostream_iterator<std::string>(std::cout,"\n"),
                   std::ptr_fun(urlencode));
}

Который, казалось, все работает:

http://foo.com/bar?abc<>de??90   210fg!"$%
http://google.com
http://www.unicode.com/example?großpösna

Становится:

http://foo.com/bar?abc%3C%3Ede%3F%3F90%20%20%20210fg%21%22%24%25
http://google.com
http://www.unicode.com/example?gro%C3%9Fp%C3%B6sna

Какие квадраты с этими примерами

3 голосов
/ 28 августа 2010

Вы можете сначала преобразовать URL-адрес Unicode в UTF8, данные UTF8 будут содержать данные Unicode в символах ASCII. Как только вы получите URL в UTF8, вы можете легко кодировать URL с помощью предпочитаемого вами API.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...