Невероятно сложно иметь настоящую базу данных в облаке из-за кислотности. Хранилища данных - это совсем другая проблема. Хранение данных не обязательно должно быть классической базой данных, в том смысле, что вы, возможно, знаете это. Cassandra и другие хранилища данных «ключ-значение» предлагают многое в том смысле, что они быстро читают и пишут, но с ними трудно отчитываться. Если вам не нужны отчеты, а ваша основная задача - скорость (то есть, у вас очень большой набор данных, где объединение не важно, как правило, не в классическом веб-смысле), тогда нечто подобное очень ценно.
Когда вы выполняете большие объемы работы с данными и т.д., тогда может возникнуть классическая база данных с высокостабильными и очень высокопроизводительными хеш-соединениями, но она может быть даже заменена реализацией Big Table с Map Сократите количество кода, работающего на многих машинах, и вы получите хорошие быстрые результаты. Реализация Big Table была построена на Hadoop, так что вы можете посмотреть там.
В хранилищах памяти, которые используются для очень быстрого поиска (например, в memcache), также используются, если вы не беспокоитесь о заполнении кэша во время выполнения, когда объект регулярно загружается на ваш сайт.
К сожалению, как только вы начнете применять транзакции и другие элементы кислотности к любому хранилищу данных, управлять им станет намного сложнее. Вот почему так много неклассических хранилищ данных баз данных отказываются от некоторых из них, чтобы повысить производительность.
Я не думаю, что «Облачная база данных» - это правильный способ взглянуть на проблему, а не «Облачное решение». Cassandra, как хранилище данных, можно рассматривать как «облачное решение» для очень большой проблемы: для очень больших наборов данных (например, Facebook, среди других сайтов), как мы можем добиться максимальной производительности? Если это означает, что не все кластеры будут обновлены после публикации, пусть будет так, если все будет работать гладко.
«Онлайн-база данных», как говорят для infodome, - это интересное словоблудие. Я думаю о онлайновой базе данных как о базе данных, которая работает (и, возможно, с ней можно связаться). Я думаю, что они имеют в виду доступную через Интернет базу данных, которая отличается. Чтобы создать подобный сайт, вам, вероятно, нужны приличные знания какого-либо хранилища данных, технически всего, что не сбрасывает данные (Memcache сбрасывает данные, cassandra - нет, postgres, mysql, oracle - все это классические базы данных, поэтому они хорошо) должно работать. Затем вам нужно будет научиться кодировать веб-сайт, я бы порекомендовал вам начать с чего-то с большим набором активных пользователей (Ruby On Rails, Drupal, хотя я никогда не использовал ни одного, проще, чем Perl Catalyst, который я предпочитаю, но, по-видимому, сложнее), затем научитесь создавать эффективный клиентский javascript и создадим для вашего приложения содержательный API xml или json.
К сожалению, это много работы. Я работаю в этой отрасли уже много лет, и я обещаю вам, что вы будете заниматься этим какое-то время, прежде чем ваши знания станут достаточными, чтобы написать собственное приложение с таким уровнем сложности. Когда вы думаете о Facebook и Twitter, они не начинали с этого уровня, но по мере их роста их основной проблемой было масштабирование, а не сложность приложения, которая отличается.
В любом случае, я надеюсь, что я ответил на несколько вопросов и подтолкнул вас в правильном направлении. Если нет, это тоже хорошо. Просто наберите, чтобы сжечь здесь некоторое время.