Тип кодировки UTF-16 с использованием wofstream в Windows - PullRequest
0 голосов
/ 23 июня 2010

Недавно я хочу написать текстовый файл в формате Unicode (UTF-16) под Windows.

При ссылке на http://www.codeproject.com/KB/stl/upgradingstlappstounicode.aspx, вот код, который я применяю.

Когда я использую Блокнот , чтобы открыть документ, здесь отображается дисплей. Новая строка, кажется, исчезла !!!

альтернативный текст http://sites.google.com/site/yanchengcheok/Home/notepad.png

Когда я использую Firefox с выбранной кодировкой UTF-16, здесь отображается экран.

альтернативный текст http://sites.google.com/site/yanchengcheok/Home/firefox-utf16-encoding.PNG

Я пытаюсь открыть в JEdit, используя следующую кодировку

  1. UTF-16 - Нет.Вывоз мусора.
  2. UTF-16BE - Нет.Дисплей для мусора.
  3. UTF-16LE - Fine.Может показывать несколько строк.

Мне кажется, мне нужно предоставить дополнительную информацию для заказа байтов?Но как?

Моя цель - сделать так, чтобы этот документ UTF-16 мог хорошо отображаться под Блокнотом, поскольку мой клиент просто любит использовать Блокнот.

P / S ПОЖАЛУЙСТА!Никогда не предлагайте мне использовать UTF-8.Спасибо.

#include <iostream>
#include <fstream>
#include <iomanip>
#include <locale>
#include <windows.h>
#include <tchar.h>
// For StringCchLengthW.
#include <Strsafe.h>
#include <cassert>

using namespace std;

// appearing in the NullCodecvtBase typedef.
using std::codecvt ; 
typedef codecvt < wchar_t , char , mbstate_t > NullCodecvtBase ;

class NullCodecvt
    : public NullCodecvtBase
{

public:
    typedef wchar_t _E ;
    typedef char _To ;
    typedef mbstate_t _St ;

    explicit NullCodecvt( size_t _R=0 ) : NullCodecvtBase(_R) { }

protected:
    virtual result do_in( _St& _State ,
                   const _To* _F1 , const _To* _L1 , const _To*& _Mid1 ,
                   _E* F2 , _E* _L2 , _E*& _Mid2
                   ) const
    {
        return noconv ;
    }
    virtual result do_out( _St& _State ,
                   const _E* _F1 , const _E* _L1 , const _E*& _Mid1 ,
                   _To* F2, _E* _L2 , _To*& _Mid2
                   ) const
    {
        return noconv ;
    }
    virtual result do_unshift( _St& _State , 
            _To* _F2 , _To* _L2 , _To*& _Mid2 ) const
    {
        return noconv ;
     }
    virtual int do_length( _St& _State , const _To* _F1 , 
           const _To* _L1 , size_t _N2 ) const _THROW0()
    {
        return (_N2 < (size_t)(_L1 - _F1)) ? _N2 : _L1 - _F1 ;
    }
    virtual bool do_always_noconv() const _THROW0()
    {
        return true ;
    }
    virtual int do_max_length() const _THROW0()
    {
        return 2 ;
    }
    virtual int do_encoding() const _THROW0()
    {
        return 2 ;
    }
} ;

#define IMBUE_NULL_CODECVT( outputFile ) \
{ \
(outputFile).imbue( std::locale(locale::classic(), new NullCodecvt )) ; \
} 

int main()
{
    std::wofstream file;
    IMBUE_NULL_CODECVT( file ) ;
    file.open(L"C:\\可以爱我吗.TXT", ios::out | ios::binary);
    file << L"ABC" << std::endl;
    file << L"我爱你" << std::endl;
    file << L"Bye bye" << std::endl;

    printf("done\n");
    getchar();
}

1 Ответ

4 голосов
/ 23 июня 2010

Когда вы делаете ios::binary, файл открывается в двоичном режиме, что означает, что переводы строки не преобразовываются в правильную кодировку \ r \ n в Windows.

Если вы пишете "\r\n" вместо std :: endl, он должен работать в Блокноте. Я не уверен, что это лучшее решение.

...