Какая база данных лучше всего подходит для хранения данных JSON для аналитики? - PullRequest
0 голосов
/ 28 октября 2019

Я хотел бы провести аналитику информации о запросах и ответах, чтобы знать пользовательский импульс и лучше обслуживать его.

Для этого я начал сохранять информацию о запросах и ответах в формате json на cassandra, так как в нашем проекте мы используем mysql и cassandra, а размер содержимого не превышает 20 атрибутов (ключпары значений), где атрибуты ответа содержат несколько абзацев текста в ответе.

Ищем некоторые мысли о том, где хранить (в какой базе данных) эту информацию JSON и какой аналитический инструмент мы можем использовать.

1 Ответ

0 голосов
/ 29 октября 2019

Я хотел бы получить больше информации о вашей конфигурации. Насколько я понимаю, поскольку вы работаете с Cassandra, данные могут быть в NoSQL.

Выбор базы данных зависит от нескольких параметров, таких как модульность полей данных, скорость передачи данных и бизнес-требования.

Аналитика данных соотносится со сложностью данных и статистической значимостью столбцов. ,Если вам нужно в памяти запустить расчеты, вы можете использовать SAS. Для расширенного статистического анализа используйте аналитику на основе R или Python. Лучше всего использовать Python для анализа, поскольку он дает вам возможность разрабатывать сложные или более простые системы.

Если вы только начинаете с чистого листа. Мой совет - работать в обратном направлении от бизнес-потребностей до дизайна стола.

  1. Сначала поймите проблему, которую пытается решить аналитика.
  2. Определите релевантность столбцов данных.
  3. Определите, хотите ли вы, чтобы ваша база данных была готова с помощью 2объединения или 3 или более соединений.
  4. Используя ранее упомянутые параметры, выберите NoSQL, PostGres или SQL. Если вы имеете дело с большими данными, используйте NoSQL, XML и избегайте Oracle.

Ссылки:

База данных, поддерживающая JSON

...