_bstr_t в UTF-8 возможно? - PullRequest
       99

_bstr_t в UTF-8 возможно?

9 голосов
/ 09 марта 2009

У меня есть строка _bstr_t, которая содержит японский текст. Я хочу преобразовать эту строку в строку UTF-8, которая определяется как char *.

Можно ли преобразовать строку _bstr_t в строку char * (UTF-8) без потери японских символов?

Ответы [ 3 ]

16 голосов
/ 09 марта 2009

Используйте WideCharToMultiByte () - передайте CP_UTF8 в качестве первого параметра.

Остерегайтесь того, что BSTR может быть нулевым указателем и соответствует пустой строке - рассматривайте это как особый случай.

1 голос
/ 10 января 2017

Вот код, который должен выполнить преобразование.

void PrintUtf8(const TCHAR* value) { 
    if (value == nullptr) {
        printf("");
        return;
    }
    int n = WideCharToMultiByte(CP_UTF8, 0, value, -1, nullptr, 0, nullptr, nullptr);
    if (n <= 0) {
        printf("");
        return;
    }
    char* buffer = new char[n];
    WideCharToMultiByte(CP_UTF8, 0, value, -1, buffer, n, nullptr, nullptr);
    printf("%s", buffer);
    delete(buffer);
}
0 голосов
/ 09 марта 2009

Очень удобный справочник MSDN для такого рода вещей: http://msdn.microsoft.com/en-us/library/ms235631(VS.80).aspx

Я думаю, вам нужно перейти к wchar_t *, так как char * потеряет Unicode, хотя я не уверен.

// convert_from_bstr_t.cpp
// compile with: /clr /link comsuppw.lib

#include <iostream>
#include <stdlib.h>
#include <string>

#include "atlbase.h"
#include "atlstr.h"
#include "comutil.h"

using namespace std;
using namespace System;

int main()
{
    _bstr_t orig("Hello, World!");
    wcout << orig << " (_bstr_t)" << endl;

    // Convert to a char*
    const size_t newsize = 100;
    char nstring[newsize];
    strcpy_s(nstring, (char *)orig);
    strcat_s(nstring, " (char *)");
    cout << nstring << endl;

    // Convert to a wchar_t*
    wchar_t wcstring[newsize];
    wcscpy_s(wcstring, (wchar_t *)orig);
    wcscat_s(wcstring, L" (wchar_t *)");
    wcout << wcstring << endl;

    // Convert to a CComBSTR
    CComBSTR ccombstr((char *)orig);
    if (ccombstr.Append(L" (CComBSTR)") == S_OK)
    {
        CW2A printstr(ccombstr);
        cout << printstr << endl;
    }

    // Convert to a CString
    CString cstring((char *)orig);
    cstring += " (CString)";
    cout << cstring << endl;

    // Convert to a basic_string
    string basicstring((char *)orig);
    basicstring += " (basic_string)";
    cout << basicstring << endl;

    // Convert to a System::String
    String ^systemstring = gcnew String((char *)orig);
    systemstring += " (System::String)";
    Console::WriteLine("{0}", systemstring);
    delete systemstring;
}
...