зависящий от локали порядок для std :: string - PullRequest
9 голосов
/ 31 августа 2009

Я пытаюсь сравнить std::string s в зависимости от локали.

Для обычных строк в стиле C я нашел strcoll, который делает именно то, что я хочу, после выполнения std::setlocale

#include <iostream>
#include <locale>
#include <cstring>

bool cmp(const char* a, const char* b)
{
    return strcoll(a, b) < 0;
}

int main()
{
    const char* s1 = "z", *s2 = "å", *s3 = "ä", *s4 = "ö";

    std::cout << (cmp(s1,s2) && cmp(s2,s3) && cmp(s3,s4)) << "\n"; //Outputs 0
    std::setlocale(LC_ALL, "sv_SE.UTF-8");
    std::cout << (cmp(s1,s2) && cmp(s2,s3) && cmp(s3,s4)) << "\n"; //Outputs 1, like it should

    return 0;
}

Однако мне бы хотелось, чтобы такое поведение было и для std::string. Я мог бы просто перегрузить operator<, чтобы сделать что-то вроде

bool operator<(const std::string& a, const std::string& b)
{
    return strcoll(a.c_str(), b.c_str());
}

но тогда мне придется беспокоиться о коде, использующем std::less и std::string::compare, поэтому он не выглядит правильным.

Есть ли способ заставить этот вид сортировки работать со строками без проблем?

Ответы [ 4 ]

8 голосов
/ 31 августа 2009

operator () из std :: locale - это то, что вы ищете. Чтобы получить текущую глобальную локаль, просто используйте конструктор по умолчанию.

6 голосов
/ 31 августа 2009

Библиотека C ++ предоставляет сортировочный фасет для выполнения сопоставления, зависящего от локали.

0 голосов
/ 31 августа 2009

После небольшого поиска я понял, что одним из способов сделать это может быть перегрузка шаблона std::basic_string для создания нового локализованного строкового класса.

В этом, вероятно, есть несколько миллиардов ошибок, но как подтверждение концепции:

#include <iostream>
#include <locale>
#include <string>

struct localed_traits: public std::char_traits<wchar_t>
{
    static bool lt(wchar_t a, wchar_t b)
    {
        const std::collate<wchar_t>& coll =
            std::use_facet< std::collate<wchar_t> >(std::locale());
        return coll.compare(&a, &a+1, &b, &b+1) < 0;
    }

    static int compare(const wchar_t* a, const wchar_t* b, size_t n)
    {
        const std::collate<wchar_t>& coll =
            std::use_facet< std::collate<wchar_t> >(std::locale());
        return coll.compare(a, a+n, b, b+n);
    }
};

typedef std::basic_string<wchar_t, localed_traits> localed_string;

int main()
{
    localed_string s1 = L"z", s2 = L"å", s3 = L"ä", s4 = L"ö";

    std::cout << (s1 < s2 && s2 < s3 && s3 < s4 ) << "\n"; //Outputs 0
    std::locale::global(std::locale("sv_SE.UTF-8"));
    std::cout << (s1 < s2 && s2 < s3 && s3 < s4 ) << "\n"; //Outputs 1

    return 0;
}

Но, похоже, он не работает, если вы основываете его на char вместо wchar_t, и я понятия не имею, почему ...

0 голосов
/ 31 августа 2009

В C ++ вам нужно использовать стандартный collate facet Проверьте это .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...