Преобразование из строки в строку приводит к потере кодировки - PullRequest
2 голосов
/ 08 марта 2010

Переменная filepath, которая является string, содержит значение Música. У меня есть следующий код:

wstring fp(filepath.length(), L' ');
copy(filepath.begin(), filepath.end(), fp.begin());

fp содержит значение M?sica. Как преобразовать filepath в fp без потери кодировки символа ú?

Ответы [ 2 ]

1 голос
/ 08 марта 2010

Используйте функцию MultiByteToWideChar.

Пример кода:

std::string toStdString(const std::wstring& s, UINT32 codePage)
{
    unsigned int bufferSize = (unsigned int)s.length()+1;
    char* pBuffer = new char[bufferSize];
    memset(pBuffer, 0, bufferSize);
    WideCharToMultiByte(codePage, 0, s.c_str(), (int)s.length(), pBuffer, bufferSize, NULL, NULL);
    std::string retVal = pBuffer;
    delete[] pBuffer;
    return retVal;
}

std::wstring toStdWString(const std::string& s, UINT32 codePage)
{
    unsigned int bufferSize = (unsigned int)s.length()+1;
    WCHAR* pBuffer = new WCHAR[bufferSize];
    memset(pBuffer, 0, bufferSize*sizeof(WCHAR));
    MultiByteToWideChar(codePage, 0, s.c_str(), (int)s.length(), pBuffer, bufferSize);
    std::wstring retVal = pBuffer;
    delete[] pBuffer;
    return retVal;
}
0 голосов
/ 09 марта 2010

Поскольку вы используете MFC, у вас есть доступ к макросам преобразования строк ATL .

Это значительно упрощает преобразование по сравнению с использованием MultiByteToWideChar. Предполагая, что filepath закодировано в кодовой странице вашей системы по умолчанию, это должно сработать:

CA2W wideFilepath(filepath.c_str());
wstring fp(static_cast<const wchar_t*>(wideFilepath));

Если filepath равно , а не в кодовой странице вашей системы по умолчанию (скажем, в UTF-8), то вы можете указать кодировку для преобразования:

CA2W wideFilepath(filepath.c_str(), CP_UTF8);
wstring fp(static_cast<const wchar_t*>(wideFilepath));

Чтобы преобразовать другой способ, из std::wstring в std::string, вы должны сделать следующее:

// Convert from wide (UTF-16) to UTF-8
CW2A utf8Filepath(fp.c_str(), CP_UTF8);
string utf8Fp(static_cast<const char*>(utf8Filepath));

// Or, convert from wide (UTF-16) to your system's default code page.
CW2A narrowFilepath(fp.c_str(), CP_UTF8);
string narrowFp(static_cast<const char*>(narrowFilepath));
...