350 Гб (рост пары ГБ в неделю) ... Все эти данные должны быть доступны для аналитики
Есть ли у вас MySQL гуру в доме? Если да, конечно => просто создайте и увеличьте этот MySQL кластер. Единственная проблема с этим решением не в том, что это MySQL, и не в том, что не NoSQL => это буквально, потому что для его настройки требуется эксперт и всегда будьте рядом с вами на случай, если это нужно изменить. Но угадайте, что => SQL на 1011 * НАМНОГО лучше и проще для аналитики, чем симуляция SQL с отображением / сокращением.
Что-то, что может стать , проблема с решением MySQL позже - Oracle . Поэтому убедитесь, что вы понимаете, какие функции MySQL можно использовать бесплатно, и за какие функции вам придется платить.
Если у вас нет у вас есть специалист по MySQL, или вы не хотите платить за него, вы определенно можете обратиться к NoSQL. Это не означает, что вам не понадобится опыт работы с продуктом NoSQL, но настройка и запуск узлов X как единой системы - чрезвычайно простой и естественный процесс для решений NoSQL.
Например, в Riak и паре других зверей NoSQL большинство сложностей с дистрибутивом решаются с помощью продукта без необходимости что-либо делать вообще => это действительно так просто.
Цена, которую вы платите с помощью NoSQL, - это потеря SQL (если подумать о хороших функциях агрегирования) и согласованности, что составляет возможное , и если вы строго занимаетесь аналитикой, для вас согласованность может вообще не быть ценой. .
Взамен вы получаете очень естественную обработку больших данных, отказоустойчивость и намного больше .
Если вы находитесь в пространстве Hadooooxyz, и у вас все в порядке, посмотрите на Hadapt , который обещает 5-кратную производительность Hive.