NoSQL или RDBMS с архитектурой MPP, такой как красное смещение или хранилище Azure для обработки данных - PullRequest
0 голосов
/ 03 ноября 2018

У меня проблема с тем, что мне нужно хранить адресные данные пользователей, которые могут поступать от разных поставщиков в разных форматах. как только у меня появятся данные, мне нужно будет очистить их, смять и запустить процесс дедупликации, чтобы получить чистые структурированные данные. как только данные очищены, мне, возможно, придется выбирать разные атрибуты адреса у разных поставщиков на основе сложной логики, которая еще не определена. мой вопрос

1) какую базу данных я должен использовать, т. Е. Семейство баз данных NOSQL, например document / keyvalue / dynamicoDB и т. Д., Или RDBMS с базой данных MPP, например красное смещение или хранилище данных Azure

2) БД NOSQL, такие как mongoDB, обеспечивают гибкость схемы, но в то же время процесс запросов или дедупликации не является чем-то встроенным для этих баз данных.

если кто-нибудь может мне в этом помочь, я буду очень благодарен за него

Спасибо Атул

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...