Я хотел бы получить больше информации о вашей конфигурации. Насколько я понимаю, поскольку вы работаете с Cassandra, данные могут быть в NoSQL.
Выбор базы данных зависит от нескольких параметров, таких как модульность полей данных, скорость передачи данных и бизнес-требования.
Аналитика данных соотносится со сложностью данных и статистической значимостью столбцов. ,Если вам нужно в памяти запустить расчеты, вы можете использовать SAS. Для расширенного статистического анализа используйте аналитику на основе R или Python. Лучше всего использовать Python для анализа, поскольку он дает вам возможность разрабатывать сложные или более простые системы.
Если вы только начинаете с чистого листа. Мой совет - работать в обратном направлении от бизнес-потребностей до дизайна стола.
- Сначала поймите проблему, которую пытается решить аналитика.
- Определите релевантность столбцов данных.
- Определите, хотите ли вы, чтобы ваша база данных была готова с помощью 2объединения или 3 или более соединений.
- Используя ранее упомянутые параметры, выберите NoSQL, PostGres или SQL. Если вы имеете дело с большими данными, используйте NoSQL, XML и избегайте Oracle.
Ссылки:
База данных, поддерживающая JSON