Вот моя проблема.
Я хочу проглотить много и много данных .... прямо сейчас миллионы, а затем миллиарды строк.
Я использую MySQL и играюпока что с PostgreSQL.
Вставить легко, но перед тем, как вставить, я хочу проверить, существуют ли эти конкретные записи или нет, если я не хочу вставлять.По мере роста БД эта операция (очевидно) занимает все больше и больше времени.
Если бы мои данные были в Hashmap, поиск был бы o (1), поэтому я решил создать индекс Hash, чтобы помочь с поиском,Но потом я понял, что если мне придется каждый раз вычислять хэш снова, я сильно замедляю процесс (и если я не вычисляю индекс, у меня нет o (1) поиска).
Так что я в затруднительном положении, есть ли простое решение?Или сложный?Я счастлив попробовать другие хранилища данных, однако мне нужно иметь возможность выполнять достаточно сложные запросы, например, что-то похожее на операторы SELECT с предложениями WHERE, поэтому я не уверен, применимы ли решения no-sql.
IЯ очень новичок, поэтому я не удивлюсь, если найдется тривиальное решение.