Question

Извините, мой C / C ++ не так хорош, но следующий существующий код выглядит даже как мусор для меня.В нем также есть ошибка - ошибка, когда str = "07/02/2010" завершается на \ 0.Я думаю, что вместо исправления ошибки ее можно переписать.В Python это просто 'kas\nhjkfh kjsdjkasf'.split().Я знаю, что это код C-ish, но это не так сложно разделить строку!Придерживаясь той же подписи и без использования дополнительных библиотек, как я могу улучшить ее - сделать ее короткой и приятной?Я могу сказать, что этот код пахнет, например, из-за предложения else до конца.

ЛИНИЯ, КОТОРАЯ НЕ СДЕЛАНА:

_tcsncpy_s(
    s.GetBuffer((int) (nIndex-nLast)),
    nIndex-nLast,
    psz+nLast,
    (size_t) (nIndex-nLast)
);

Со строкой"завершается '\ 0', он будет пытаться записать 11 символов в буфер длиной всего 10 символов.

ПОЛНАЯ ФУНКЦИЯ:

#define 

// This will return the text string as a string array
// This function is called from SetControlText to parse the
// text string into an array of CStrings that the control
// Gadgets will attempt to interpret

BOOL CLVGridDateTimeCtrl::ParseTextWithCurrentFormat(const CString& str, const CGXStyle* pOldStyle, CStringArray& strArray )
{
    // Unused:
    pOldStyle;

    // we assume that the significant segments are seperated by space

    // Please change m_strDelim to add other delimiters

    CString s;

    LPCTSTR psz = (LPCTSTR) str;

    BOOL bLastCharSpace = FALSE;
    DWORD size = str.GetLength()+1;

    // (newline will start a new row, tab delimiter will
    // move to the next column).
    // parse buffer (DBCS aware)
    for (DWORD nIndex = 0, nLast = 0; nIndex < size; nIndex += _tclen(psz+nIndex))
    {
        // check for a delimiter
        if (psz[nIndex] == _T('\0') || _tcschr(_T("\r\n"), psz[nIndex]) || _tcschr(_T(" "), psz[nIndex])
            ||!_tcscspn(&psz[nIndex], (LPCTSTR)m_strDelim))
        {
            s.ReleaseBuffer();
            s.Empty();
            // abort parsing the string if next char
            // is an end-of-string
            if (psz[nIndex] == _T('\0'))
            {
                if (psz[nIndex] == _T('\r') && psz[nIndex+1] == _T('\n'))
                    nIndex++;

                _tcsncpy_s(s.GetBuffer((int) (nIndex-nLast)),
                    nIndex-nLast,
                            psz+nLast,
                            (size_t) (nIndex-nLast));
                CString temStr = s;
                strArray.Add(temStr);
                temStr.Empty();
                break;
            }

            else if (_tcscspn(&psz[nIndex], (LPCTSTR)m_strDelim) == 0 && !bLastCharSpace)
            {
                if (psz[nIndex] == _T('\r') && psz[nIndex+1] == _T('\n'))
                    nIndex++;

                _tcsncpy_s(s.GetBuffer((int) (nIndex-nLast)),
                    nIndex-nLast,
                            psz+nLast,
                            (size_t) (nIndex-nLast));
                CString temStr = s;
                strArray.Add(temStr);
                temStr.Empty();
                bLastCharSpace = TRUE;
                // abort parsing the string if next char
                // is an end-of-string
                if (psz[nIndex+1] == _T('\0'))
                    break;

            }
            // Now, that the value has been copied to the cell,
            // let's check if we should jump to a new row.
            else if (_tcschr(_T(" "), psz[nIndex]) && !bLastCharSpace)
            {
                if (psz[nIndex] == _T('\r') && psz[nIndex+1] == _T('\n'))
                    nIndex++;

                _tcsncpy_s(s.GetBuffer((int) (nIndex-nLast)),
                    nIndex-nLast,
                            psz+nLast,
                            (size_t) (nIndex-nLast));
                CString temStr = s;
                strArray.Add(temStr);
                temStr.Empty();
                bLastCharSpace = TRUE;
                // abort parsing the string if next char
                // is an end-of-string
                if (psz[nIndex+1] == _T('\0'))
                    break;
            }

            nLast = nIndex + _tclen(psz+nIndex);


        }
        else
        {   
            // nLast = nIndex + _tclen(psz+nIndex);
            bLastCharSpace = FALSE;
        }
    }
    if (strArray.GetSize())
        return TRUE;
    else
        return FALSE;
}

РЕДАКТИРОВАТЬ: m_strDelim = _T(","); и эта переменная-член используется только в этой функции.Полагаю, теперь я вижу смысл токенизации - она пытается проанализировать дату и время ... подождите, это еще не все!Вот код, который вызывает эту функцию ниже.Пожалуйста, помогите мне улучшить это тоже.Некоторые из моих коллег утверждают, что C # делает их не более производительными, чем C ++.Раньше я чувствовал себя идиотом из-за того, что не могу сказать то же самое обо мне.

// SetControlText will attempt to convert the text to a valid date first with
// the help of COleDateTime and then with the help of the Date control and the
// current format

BOOL CLVGridDateTimeCtrl::ConvertControlTextToValue(CString& str, ROWCOL nRow, ROWCOL nCol, const CGXStyle* pOldStyle)
{
    CGXStyle* pStyle = NULL;
    BOOL bSuccess = FALSE;

    if (pOldStyle == NULL)
    {
        pStyle = Grid()->CreateStyle();
        Grid()->ComposeStyleRowCol(nRow, nCol, pStyle);
        pOldStyle = pStyle;
    }

    // allow only valid input
    {
        // First do this
        CLVDateTime dt;

        if (str.IsEmpty())
        {
            ;
            // if (Grid()->IsCurrentCell(nRow, nCol))
            //  Reset();
            bSuccess = TRUE;
        }
        else if (dt.ParseDateTime(str,CLVGlobals::IsUSDateFormat()) && (DATE) dt != 0)
        {
            SetDateTime(dt);
            if (m_bDateValueAsNumber)
                str.Format(_T("%g"), (DATE) dt);
            else
                str = dt.Format();
            bSuccess = TRUE;
        }
        else
        {
            // parse the string using the current format
            CStringArray strArray;
            if (!ParseTextWithCurrentFormat(str, pOldStyle, strArray))
                return FALSE;

            UpdateNullStatus(m_TextCtrlWnd);

            SetFormat(m_TextCtrlWnd, *pOldStyle);

            int nArrIndex = 0;
            for(int i=0; i<m_TextCtrlWnd.m_gadgets.GetSize(); i++)
            {
                int val = m_TextCtrlWnd.m_gadgets[i]->GetValue();   
                // s.Empty();
                if(m_TextCtrlWnd.m_gadgets[i]->IsKindOf(RUNTIME_CLASS(SECDTNumericGadget)))
                {
                    // TRACE(_T("The value %s\n"), strArray[nArrIndex]);
                    ((CLVDTNumericGadget*)m_TextCtrlWnd.m_gadgets[i])->m_nNewValue = _ttoi(strArray[nArrIndex]);    
                    nArrIndex++;
                    if (nArrIndex>strArray.GetUpperBound())
                            break;
                }
                else if(m_TextCtrlWnd.m_gadgets[i]->IsKindOf(RUNTIME_CLASS(SECDTListGadget)) && val!=-1)
                {
                    int nIndex = ((CLVDTListGadget*)m_TextCtrlWnd.m_gadgets[i])->FindMatch(strArray[nArrIndex], ((CLVDTListGadget*)m_TextCtrlWnd.m_gadgets[i])->GetValue()+1);
                    if (nIndex!=-1)
                    {
                        // TRACE(_T("The value %s\n"), strArray[nArrIndex]);
                        ((CLVDTListGadget*)m_TextCtrlWnd.m_gadgets[i])->SetValue(nIndex);
                        nArrIndex++;
                        if (nArrIndex>strArray.GetUpperBound())
                            break;
                    }

                }

                CLVDBValue dbDate = m_TextCtrlWnd.GetDateTime();
                if (dbDate.IsNull())
                    str = _T("");
                else
                {
                    CLVDateTime dt = (CLVDateTime)dbDate;
                    if (m_bDateValueAsNumber)
                        str.Format(_T("%g"), (DATE) dt);
                    else
                        str = dt.Format();
                }
            }
            bSuccess = TRUE;
        }
    }

    if (pStyle)
        Grid()->RecycleStyle(pStyle);

    return bSuccess;
}

Miguel A. Friginal · Answer 1 · 02 июля 2010

Библиотека String Toolkit (Strtk) имеет следующее решение вашей проблемы:

#include <string>
#include <deque>
#include "strtk.hpp"
int main()
{ 
   std::string data("kas\nhjkfh kjsdjkasf");
   std::deque<std::string> str_list;
   strtk::parse(data, ", \r\n", str_list);
   return 0;
}

Можно найти больше примеров Здесь

Jerry Coffin · Answer 2 · 02 июля 2010

В C ++, вероятно, проще всего использовать stsringstream:

std::istringstream buffer("kas\nhjkfh kjsdjkasf");

std::vector<std::string> strings;

std::copy(std::istream_iterator<std::string>(buffer),
          std::istream_iterator<std::string>(),
          std::back_inserter(strings));

Я не пытался придерживаться одной и той же подписи, в основном потому, что большинство из них нестандартные, поэтомуне относится к C ++ в целом.

Другая возможность заключается в использовании Boost::tokenizer, хотя очевидно, что это касается другой библиотеки, поэтому я не буду пытаться охватить ее более подробнодеталь.

Я не уверен, квалифицируется ли это как "bizarro синтаксис" или нет.Возможно, мне придется немного поработать над этой частью ...

Редактировать: я понял - вместо этого инициализировать вектор:

std::istringstream buffer("kas\nhjkfh kjsdjkasf");

std::vector<std::string> strings(
    (std::istream_iterator<std::string>(buffer)),
    std::istream_iterator<std::string>());

Часть "bizarro" - это то, что бездополнительные круглые скобки вокруг первого аргумента, это вызвало бы «самый неприятный синтаксический анализ», поэтому вместо определения вектора была бы объявлена функция.: -)

Edit2: Поскольку редактирование вопроса идет, кажется, почти невозможно ответить напрямую - это зависит от слишком большого количества типов (например, CGXStyle, CLVDateTime), которые не являются ни стандартными, ни объясненными.Я, например, не могу следить за этим в любой детали вообще.Случайно, это выглядит как довольно плохой дизайн, позволяющий пользователю вводить более или менее неоднозначные вещи, а затем пытающийся разобраться в беспорядке.Лучше использовать элемент управления, который позволяет начинать только однозначный ввод, и вы можете просто прочитать некоторые поля, которые содержат дату и время напрямую.

Edit3: код для разделения, который также обрабатывает запятые как разделители.сделано так:

#include <iostream>
#include <locale>
#include <algorithm>
#include <vector>
#include <sstream>

class my_ctype : public std::ctype<char> {
public:
    mask const *get_table() { 
        // this copies the "classic" table used by <ctype.h>:
        static std::vector<std::ctype<char>::mask> 
            table(classic_table(), classic_table()+table_size);

        // Anything we want to separate tokens, we mark its spot in the table as 'space'.
        table[','] = (mask)space;

        // and return a pointer to the table:
        return &table[0];
    }
    my_ctype(size_t refs=0) : std::ctype<char>(get_table(), false, refs) { }
};

int main() { 
    // put our data in a strea:
    std::istringstream buffer("first kas\nhjkfh kjsdjk,asf\tlast");

    // Create a ctype object and tell the stream to use it for parsing tokens:
    my_ctype parser;
    buffer.imbue(std::locale(std::locale(), &parser));

    // separate the stream into tokens:
    std::vector<std::string> strings(
        (std::istream_iterator<std::string>(buffer)),
        std::istream_iterator<std::string>());

    // copy the tokes to cout so we can see what we got:
    std::copy(strings.begin(), strings.end(), 
        std::ostream_iterator<std::string>(std::cout, "\n"));
    return 0;
}

adam_0 · Answer 3 · 02 июля 2010

Лучший способ сделать это - использовать strtok . Эта ссылка не требует пояснений о том, как ее использовать, и вы также можете использовать несколько разделителей. Очень удобная функция C.

Simon Walker · Answer 4 · 02 июля 2010

Самый простой способ решить эту проблему - использовать библиотеки Qt.Если вы используете KDE, то они уже установлены.Класс QString имеет функцию-член split, которая работает как версия Python.Например,

QString("This is a string").split(" ", QString::SkipEmptyParts)

возвращает QStringList из QString с:

["This", "is", "a", "string"]

(в синтаксисе питона).Обратите внимание, что второй аргумент обязателен, иначе, если слова будут разделены на несколько пробелов, будет возвращен каждый отдельный.

В общем, я нахожу с помощью библиотек Qt большую часть простоты python, например.простой анализ строки и итерация списка, могут быть выполнены легко и с силой C ++.

adam_0 · Answer 5 · 27 июля 2010

Лучший метод, чем мой другой ответ: Функция регулярного выражения TR1. Вот небольшой учебник, с которого можно начать.Этот ответ на C ++, использует регулярные выражения (что, возможно, является лучшим / самым простым способом разбить строку), и я недавно использовал его сам, поэтому я знаю, что это хороший инструмент.

Billy ONeal · Answer 6 · 02 июля 2010

Вы можете использовать boost::algorithm::split.Т.е.:

std::string myString;
std::vector<std::string> splitStrings;
boost::algorithm::split(splitStrings, myString, boost::is_any_of(" \r\n"));

Mark Wilkins · Answer 7 · 02 июля 2010

Разбор строк в C / C ++ редко оказывается простым делом.Похоже, что метод, который вы опубликовали, включает в себя немало «истории».Например, вы заявляете, что хотите разбить строку на пустое пространство.Но сам метод, кажется, использует переменную-член m_strDelim как часть решения о разделении.Простая замена метода может привести к другим неожиданным проблемам.

Использование существующего класса токенизации , такого как эта библиотека Boost , может немного упростить ситуацию.

Лучший способ разбить строку на массив строк в C / C ++, используя пробел в качестве разделителя

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 7 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Лучший способ разбить строку на массив строк в C / C ++, используя пробел в качестве разделителя

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 7 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов