Отличный вопрос. Я знаю несколько компаний, которые сделали это (Facebook выскочил как крупнейший). Никто не счастлив, но альтернативы отстой тоже.
Еще несколько вещей, которые вы должны рассмотреть - что произойдет, если произойдет сбой некоторых из этих баз данных или серверов? Что происходит, когда вам нужно выполнить кросс-запрос к базе данных (и вы это сделаете, даже если вы сейчас так не думаете).
Вот решение FriendFeed: http://bret.appspot.com/entry/how-friendfeed-uses-mysql
Это немного "задом наперед", поскольку они в основном используют MySQL в качестве прославленного хранилища значений ключей. Я не уверен, почему они не просто вырезали посредника и использовали что-то вроде BerkeleyDB для хранения своих объектов. Управление подключением, может быть? Похоже, что издержки MySQL были бы слишком высокими, чтобы платить за то, что можно было бы добавить довольно легко (известные последние слова).
То, что вы действительно ищете (я думаю), это распределенная база данных без совместного использования. Некоторые были построены на основе технологий с открытым исходным кодом, таких как MySQL и PostgreSQL, но ни одна не доступна бесплатно. Если вы в настроении для покупки, проверьте эти компании: Greenplum , AsterData , Netezza , Vertica .
Существует также большое количество различных распределенных решений хранения ключей-значений. Из-за отсутствия лучшей справки, вот отправная точка: http://www.metabrew.com/article/anti-rdbms-a-list-of-distributed-key-value-stores/.