Question

Я использую std::string метод find(), чтобы проверить, является ли строка подстрокой другой. Теперь мне нужна без учета регистра версия того же самого. Для сравнения строк я всегда могу обратиться к stricmp(), но, похоже, stristr().

Я нашел разные ответы, и большинство предлагают использовать Boost, что не подходит в моем случае. Кроме того, мне нужно поддерживать std::wstring / wchar_t. Есть идеи?

Kirill V. Lyadvinsky · Answer 1 · 30 июня 2010

Вы можете использовать std::search с пользовательским предикатом.

#include <locale>
#include <iostream>
#include <algorithm>
using namespace std;

// templated version of my_equal so it could work with both char and wchar_t
template<typename charT>
struct my_equal {
    my_equal( const std::locale& loc ) : loc_(loc) {}
    bool operator()(charT ch1, charT ch2) {
        return std::toupper(ch1, loc_) == std::toupper(ch2, loc_);
    }
private:
    const std::locale& loc_;
};

// find substring (case insensitive)
template<typename T>
int ci_find_substr( const T& str1, const T& str2, const std::locale& loc = std::locale() )
{
    typename T::const_iterator it = std::search( str1.begin(), str1.end(), 
        str2.begin(), str2.end(), my_equal<typename T::value_type>(loc) );
    if ( it != str1.end() ) return it - str1.begin();
    else return -1; // not found
}

int main(int arc, char *argv[]) 
{
    // string test
    std::string str1 = "FIRST HELLO";
    std::string str2 = "hello";
    int f1 = ci_find_substr( str1, str2 );

    // wstring test
    std::wstring wstr1 = L"ОПЯТЬ ПРИВЕТ";
    std::wstring wstr2 = L"привет";
    int f2 = ci_find_substr( wstr1, wstr2 );

    return 0;
}

CC. · Answer 2 · 07 ноября 2013

Новый стиль C ++ 11:

#include <algorithm>
#include <string>
#include <cctype>

/// Try to find in the Haystack the Needle - ignore case
bool findStringIC(const std::string & strHaystack, const std::string & strNeedle)
{
  auto it = std::search(
    strHaystack.begin(), strHaystack.end(),
    strNeedle.begin(),   strNeedle.end(),
    [](char ch1, char ch2) { return std::toupper(ch1) == std::toupper(ch2); }
  );
  return (it != strHaystack.end() );
}

Описание std :: search можно найти на cplusplus.com .

DavidS · Answer 3 · 30 июня 2010

Почему бы просто не преобразовать обе строки в нижний регистр перед вызовом find()?

ToLower

Примечание:

Неэффективно для длинных строк.
Остерегайтесь вопросов интернационализации .

gast128 · Answer 4 · 04 ноября 2014

почему бы не использовать Boost.StringAlgo:

#include <boost/algorithm/string/find.hpp>

bool Foo()
{
   //case insensitive find

   std::string str("Hello");

   boost::iterator_range<std::string::const_iterator> rng;

   rng = boost::ifind_first(str, std::string("EL"));

   return rng;
}

stinky472 · Answer 5 · 30 июня 2010

Поскольку вы выполняете поиск по подстроке (std :: string), а не по элементам (символам), к сожалению, не существует никакого существующего решения, о котором я знаю, оно было бы доступно в стандартной библиотеке для этого.

Тем не менее, это достаточно просто сделать: просто преобразовать обе строки в верхний регистр (или оба в нижний регистр - я выбрал верхний регистр в этом примере).

std::string upper_string(const std::string& str)
{
    string upper;
    transform(str.begin(), str.end(), std::back_inserter(upper), toupper);
    return upper;
}

std::string::size_type find_str_ci(const std::string& str, const std::string& substr)
{
    return upper(str).find(upper(substr) );
}

Это не быстрое решение (граничит с пессимизациейтерритория) но это единственное, что я знаю о безрассудстве.Также не так сложно реализовать свой собственный нечувствительный к регистру искатель подстрок, если вы беспокоитесь об эффективности.

Кроме того, мне нужно поддерживать std :: wstring / wchar_t.Любые идеи?

tolower / toupper в локали также будет работать с широкими строками, поэтому приведенное выше решение должно быть таким же применимым (простое изменение std :: string на std :: wstring).

[Редактировать] Альтернативой, как было указано, является адаптация вашего собственного нечувствительного к регистру типа строки из basic_string путем указания ваших собственных черт характера.Это работает, если вы можете принять все строки поиска, сравнения и т. Д. Без учета регистра для данного типа строки.

Boris Ivanov · Answer 6 · 31 декабря 2013

Также имеет смысл предоставить версию Boost: Это изменит исходные строки.

#include <boost/algorithm/string.hpp>

string str1 = "hello world!!!";
string str2 = "HELLO";
boost::algorithm::to_lower(str1)
boost::algorithm::to_lower(str2)

if (str1.find(str2) != std::string::npos)
{
    // str1 contains str2
}

или использование совершенной библиотеки Boost xpression

#include <boost/xpressive/xpressive.hpp>
using namespace boost::xpressive;
....
std::string long_string( "very LonG string" );
std::string word("long");
smatch what;
sregex re = sregex::compile(word, boost::xpressive::icase);
if( regex_match( long_string, what, re ) )
{
    cout << word << " found!" << endl;
}

В этом примереобратите внимание, что в вашем поисковом слове нет специальных символов регулярного выражения.

Philipp · Answer 7 · 30 июня 2010

Если вы хотите «реальное» сравнение в соответствии с правилами Unicode и локали, используйте ICU Collator class .

kayleeFrye_onDeck · Answer 8 · 28 июня 2018

Мне нравятся ответы от Кирилла В. Лядвинского и СС . но моя проблема была немного более конкретной, чем просто нечувствительность к регистру; Мне нужен ленивый анализатор аргументов командной строки с поддержкой Unicode, который мог бы устранить ложноположительные / отрицательные значения при поиске буквенно-цифровых строк, в которых могли быть специальные символы в базовой строке, используемой для форматирования алфавитных ключевых слов, по которым я искал, например, Wolfjäger не должен соответствовать jäger, но <jäger> должен.

Это в основном просто ответ Кирилла / СиСи с дополнительной обработкой буквенно-цифровых совпадений точной длины.

/* Undefined behavior when a non-alpha-num substring parameter is used. */
bool find_alphanum_string_CI(const std::wstring& baseString, const std::wstring& subString)
{
    /* Fail fast if the base string was smaller than what we're looking for */
    if (subString.length() > baseString.length()) 
        return false;

    auto it = std::search(
        baseString.begin(), baseString.end(), subString.begin(), subString.end(),
        [](char ch1, char ch2)
        {
            return std::toupper(ch1) == std::toupper(ch2);
        }
    );

    if(it == baseString.end())
        return false;

    size_t match_start_offset = it - baseString.begin();

    std::wstring match_start = baseString.substr(match_start_offset, std::wstring::npos);

    /* Typical special characters and whitespace to split the substring up. */
    size_t match_end_pos = match_start.find_first_of(L" ,<.>;:/?\'\"[{]}=+-_)(*&^%$#@!~`");

    /* Pass fast if the remainder of the base string where
       the match started is the same length as the substring. */
    if (match_end_pos == std::wstring::npos && match_start.length() == subString.length()) 
        return true;

    std::wstring extracted_match = match_start.substr(0, match_end_pos);

    return (extracted_match.length() == subString.length());
}

ziomq1991 · Answer 9 · 06 августа 2015

#include <iostream>
using namespace std;

template <typename charT>
struct ichar {
    operator charT() const { return toupper(x); }
    charT x;
};
template <typename charT>
static basic_string<ichar<charT> > *istring(basic_string<charT> &s) { return (basic_string<ichar<charT> > *)&s; }
template <typename charT>
static ichar<charT> *istring(const charT *s) { return (ichar<charT> *)s; }

int main()
{
    string s = "The STRING";
    wstring ws = L"The WSTRING";
    cout << istring(s)->find(istring("str")) << " " << istring(ws)->find(istring(L"wstr"))  << endl;
}

Немного грязно, но коротко и быстро.

Без учета регистра std :: string.find ()

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 9 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Без учета регистра std :: string.find ()

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 9 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы