как использовать boost :: unordered_map - PullRequest
1 голос
/ 21 октября 2010

для моего приложения мне нужно использовать хэш-карту, поэтому я написал тестовую программу, в которой я храню некоторые экземпляры базового класса в boost :: unordered_map. но я хочу достичь экземпляров, вызывая специальные функции, которые возвращают производный класс базы, и я использую параметры этих функций для хеш-ключа unordered_map. если класс с определенными параметрами не найден, класс создается и сохраняется в карте. цель программы может быть не ясна, но вот код.

#include <boost/unordered_map.hpp>
#include <iostream>

using namespace std;
using namespace boost;
typedef unsigned char BYT;
typedef unsigned long long ULL;

class BaseClass
{
public:
    int sign;
    size_t HASHCODE;
    BaseClass(){}
};

class  ClassA : public BaseClass
{
public:
    int AParam1;
    int AParam2;
    ClassA(int s1, int s2) : AParam1(s1), AParam2(s2)
    {
        sign = AParam1;
    }
};


struct HashKey
{
    ULL * hasharray;
    size_t hashNum;
    size_t HASHCODE;
    HashKey(ULL * ULLarray,  size_t Hashnum) : hasharray(ULLarray), hashNum(Hashnum), HASHCODE(0)
    {   }
    bool operator == (const HashKey & hk ) const
    {
        bool deg = (hashNum == hk.hashNum);
        if (deg)
        {
            for (int i = 0; i< hashNum;i++)
                if(hasharray[i] != hk.hasharray[i]) return false;
        }
        return deg;
    }
};

struct ihash : std::unary_function<HashKey, std::size_t>
{
    std::size_t operator()(HashKey const & x) const
    {
        std::size_t seed = 0;
        if (x.hashNum == 1)
            seed = x.hasharray[0];
        else
        {
            int amount = x.hashNum * 8;
            const std::size_t fnv_prime = 16777619u;
            BYT * byt = (BYT*)x.hasharray;
            for (int i = 0; i< amount;i++)
            {
                seed ^= byt[0];
                seed *= fnv_prime;
            }
        }
        return seed;
    }
};

typedef std::pair<HashKey,BaseClass*> HashPair;
unordered_map<HashKey,BaseClass*,ihash> UMAP;
typedef unordered_map<HashKey,BaseClass*,ihash>::iterator iter;


BaseClass * & FindClass(ULL* byt, int Num, size_t & HCode)
{
    HashKey hk(byt,Num); 
    HashPair hp(hk,0);
    std::pair<iter,bool> xx = UMAP.insert(hp);
//  if (xx.second) UMAP.rehash((UMAP.size() + 1) / UMAP.max_load_factor() + 1);
    if (!xx.first->second) HCode = UMAP.hash_function()(hk);
    return xx.first->second;
}


template <typename T, class A,class B> 
T* GetClass(size_t& hashcode ,A a, B b)
{   
    ULL byt[3] = {a,b,hashcode};
    BaseClass *& cls = FindClass(byt, 3, hashcode);
    if(! cls){ cls = new T(a,b); cls->HASHCODE = hashcode;}
    return static_cast<T*>(cls);
}



ClassA * findA(int Period1, int Period2)
{
    size_t classID = 100;
    return GetClass<ClassA>(classID,Period1,Period2);
}

int main(int argc, char* argv[])
{
    int limit = 1000;
     int modnum = 40;
    int result = 0;

    for(int i = 0 ; i < limit; i++ )
    {
        result += findA( rand() % modnum ,4)->sign ;
    }

    cout << UMAP.size() << "," << UMAP.bucket_count() << "," << result <<  endl;

    int x = 0;

    for(iter it =  UMAP.begin(); it != UMAP.end(); it++)
    {
        cout << ++x << "," << it->second->HASHCODE << "," << it->second->sign << endl ;
        delete it->second;

    }

    return 0;
}

проблема в том, что я ожидаю, что размер UMAP равен modnum, однако он всегда больше, чем modnum, что означает, что существует несколько экземпляров с одинаковыми параметрами и HASHCODE

каково решение моей проблемы? пожалуйста, помогите.
спасибо

Ответы [ 2 ]

3 голосов
/ 21 октября 2010

Вот пара проблем дизайна:

struct HashKey
{
    ULL * hasharray;
    ...

Ваш тип ключа хранит указатель на некоторый массив. Но этот указатель инициализируется с адресом локального объекта:

BaseClass * & FindClass(ULL* byt, int Num, size_t & HCode)
{
    HashKey hk(byt,Num); // <-- !!!
    HashPair hp(hk,0);
    std::pair<iter,bool> xx = UMAP.insert(hp);
    if (!xx.first->second) HCode = UMAP.hash_function()(hk);
    return xx.first->second;
}

template <typename T, class A,class B> 
T* GetClass(size_t& hashcode ,A a, B b)
{   
    ULL byt[3] = {a,b,hashcode}; // <-- !!!
    BaseClass *& cls = FindClass(byt, 3, hashcode);
    if(! cls){ cls = new T(a,b); cls->HASHCODE = hashcode;}
    return static_cast<T*>(cls);
}

Это заставляет карту хранить объект HashKey с висящим указателем. Также вы возвращаете ссылку на член локального объекта функции с именем xx в FindClass. Использование этой ссылки вызывает неопределенное поведение.

Подумайте о переименовании типа ключа карты. Сам хеш-код не должен быть ключом. И, как предполагает ваш оператор == для HashKey, вы не хотите, чтобы фактический ключ был хеш-кодом, а последовательность целых чисел переменной длины. Кроме того, рассмотрите возможность хранения последовательности внутри типа ключа вместо указателя, например, как вектор. Кроме того, избегайте возврата ссылок на локальные объекты функций.

1 голос
/ 21 октября 2010

Использование unordered_map не гарантирует, что вы не получите коллизии, что вы и описали здесь.

существует более одного экземпляра имеет те же параметры и HASHCODE

Вы можете настроить свой алгоритм хеширования, чтобы минимизировать это, но в (неизбежном) случае коллизии контейнер хеша расширяет список объектов в корзине, соответствующих этому хэш-коду. Сравнение равенства затем используется для разрешения столкновения с конкретным совпадающим объектом. Возможно, в этом ваша проблема - возможно, ваш operator== неправильно устраняет неоднозначность аналогичных, но не идентичных объектов.

Вы не можете ожидать один объект на контейнер, иначе контейнер станет неограниченным в случаях большого размера коллекции.

Кстати, если вы используете более новый компилятор, вы можете обнаружить, что он поддерживает std::unordered_map, поэтому вы можете использовать его (официальную версию STL) вместо Boost-версии.

...