Как я могу прочитать двоичные данные из wfstream? - PullRequest
5 голосов
/ 02 октября 2008

У меня небольшая проблема с чтением данных из файла. Я хочу иметь возможность читать wstring, а также кусок необработанных данных произвольного размера (размер в байтах).

std::wfstream stream(file.c_str());

std::wstring comType;
stream >> comType;

int comSize;
stream >> comSize;

char *comData = new char[comSize];
memset(comData, 0, comSize);
stream.read(comData, comSize); 
//error C2664 : 'std::basic_istream<_Elem,_Traits>::read' 
//            : cannot convert parameter 1 from 'char *' to 'wchar_t *'

Возможно, я использую неправильные потоки или что-то в этом роде. По сути, я хочу прочитать wstring, размер данных, за которыми следуют (это может быть любое количество байтов), а затем столько байтов данных компонента. Очевидно, я не могу читать символы, потому что шаблон предполагает wchar_t.

Я могу прочитать wchar_t, но затем я должен убедиться, что данные сохранены как выровненные по sizeof (wchar_t). В противном случае я мог бы испортить поток. Сценарий будет, когда данные 15 байтов. Мне нужно было бы прочитать 16 байтов, затем замаскировать нежелательный байт, найти поток со смещением в 15 байтов (если это возможно с шаблоном wchar_t?), Чтобы иметь возможность прочитать следующий блок данных.

Очевидно, что должно быть более хорошим способом достижения того, что я пытаюсь сделать.

Ответы [ 3 ]

2 голосов
/ 02 октября 2008

проблема с stream.read заключается в том, что он использует wchar_t как "символьную единицу" с wfstream. Если вы используете fstream, он использует char как «символьную единицу».

Это сработает, если вы хотите читать широкие символы:

wchar_t *comData = new wchar_t[comSize];
stream.read(comData, comSize);

Также 15 байтов данных не могут быть прочитаны широким потоком, потому что наименьшая единица составляет не менее 2 байтов (см. Ниже), поэтому вы можете читать только фрагменты sizwof (wchar_t) * n.

Но если вы беспокоитесь о переносимости приложения, wfstream / wchar_t, возможно, не лучшее решение, потому что нет стандарта, какова ширина wchar_t (например, в Windows wchar_t составляет 16 бит во многих системах Unix / Linux, это 32 бит). 1008 *

Вторая проблема с сохранением текста в виде широких символов - это endianess, я бы предложил использовать UTF-8 для хранения текста.

1 голос
/ 02 октября 2008

Учитывая ваши требования, я не думаю, что wfstream - это путь. Рекомендуется использовать что-то вроде следующего фрагмента кода.

#include "stdafx.h"
#include <fstream>
#include <iostream>

int _tmain(int argc, _TCHAR* argv[])
{
    std::wstring str(L"hello");
    size_t size1 = str.length();
    char data[] = { 0x10, 0x20, 0x30 };
    size_t size2 = 3;

    FILE* output = NULL;
    if (_wfopen_s(&output, L"c:\\test.bin", L"wb") == 0) {
        fwrite(&size1, sizeof(size_t), 1, output);
        fwrite(str.c_str(), size1 * sizeof(wchar_t), 1, output);
        fwrite(&size2, sizeof(size_t), 1, output);
        fwrite(data, size2, 1, output);

        fclose(output);
    }

    FILE* input = NULL;
    if (_wfopen_s(&input, L"c:\\test.bin", L"rb") == 0) {
        fread(&size1, sizeof(size_t), 1, input);
        wchar_t* wstr = new wchar_t[size1 + 1];
        fread(wstr, size1 * sizeof(wchar_t), 1, input);
        std::wstring str(wstr, size1);
        delete[] wstr;
        fread(&size2, sizeof(size_t), 1, input);
        char* data1 = new char[size2];
        fread(data1, size2, 1, input);

        std::wcout << str.c_str() << std::endl;
        for (size_t i = 0; i < size2; ++i) {
            std::wcout << std::hex << "0x" << int(data1[i]) << std::endl;
        }

        delete[] data1;

        fclose(input);
    }

    return 0;
}

Это выводит:

hello
0x10
0x20
0x30
0 голосов
/ 15 января 2014
# ifdef UNICODE
#     define tfstream wfstream
# else
#     define tfstream fstream
# endif

tfstream fs( _T("filename.bin"), tfstream::binary );
byte buffer[1023];
fs.read( buffer, sizeof(buffer) )

Я думаю, _T ("filename.bin") и tfstream - это выражение пользовательского интерфейса; буфер и read () являются выражением DATA LOGIC. wfstream НЕ ДОЛЖЕН ограничивать буфер типом wchar_t. Пользовательский интерфейс НЕ должен смешиваться с ЛОГИКОЙ ДАННЫХ! wfstream делает не то, что нужно

...