Есть ли какие-то «ошибки» при развертывании кластера Cassandra для набора экземпляров Linode VPS? - PullRequest
11 голосов
/ 18 февраля 2010

Я изучаю базу данных Apache Cassandra [sic].

Есть ли у кого-нибудь хорошие / плохие опыты с развертыванием Cassandra на менее специализированном оборудовании, таком как предложения Linode или Slicehost?

Я думаю, что Cassandra был бы отличным способом легко масштабировать веб-сервис для удовлетворения нагрузки чтения / записи / запроса ... просто добавьте еще один Linode, на котором работает узел Cassandra, в существующий кластер. Да, это подразумевает запуск общедоступной веб-службы и узла Cassandra на одном и том же VPS (что многие могут исключить).

Плюсы Linode-подобного развертывания для Cassandra:

  • Частная VLAN; узлы Кассандры могут общаться в частном порядке
  • API для предоставления нового Linode (и, возможно, для его настройки с помощью «StackScript», который устанавливает Cassandra и его зависимости и т. Д.)
  • Цена правильная

Минусы:

  • Каждый хост является VPS и, конечно, не выделен
  • Соотношение ОЗУ / стоимость не так уж велико, если вы решите, что хотите 4 ГБ ОЗУ (см., Скажем, на SoftLayer)
  • Только 1 диск, на котором один предпочел бы 2 диска, я полагаю (1 для журнала фиксации и другой диск для самих файлов данных). Вероятно, спорный вопрос, так как в любом случае это общее оборудование.

РЕДАКТИРОВАТЬ: нашел это, что немного помогает: http://wiki.apache.org/cassandra/CassandraHardware

Я вижу, что 1 ГБ - это минимум, но это рекомендация? Могу ли я развернуть, например, Linode 720 (скажем, 500 МБ для использования с Кассандрой)? См http://www.linode.com/

1 Ответ

5 голосов
/ 19 февраля 2010

Сколько оперативной памяти вам действительно нужно, зависит от вашей рабочей нагрузки: если вы в основном пишете, вы можете получить меньше, иначе вам понадобится оперативная память для кэша чтения.

Вы получаете больше оперативной памяти за деньги у моего работодателя, облачное пространство: http://www.rackspacecloud.com/cloud_hosting_products/servers/pricing. (на наших машинах также есть набитые диски, поэтому люди обычно видят лучшую производительность ввода-вывода по сравнению с EC2. Не знаю о линоде.)

Поскольку с большинством VPS вы платите примерно в 2 раза больше за экземпляр следующего размера, т. Е. Примерно столько же, сколько за добавление второго небольшого экземпляра, я бы рекомендовал использовать меньшее количество больших экземпляров, чем большее количество меньших, поскольку в сети с небольшим числом накладные расходы не пренебрежимо малы.

Я знаю кого-то, кто использовал Cassandra на виртуальных машинах 256 МБ, но вы определенно в меньшинстве, если вы так мало.

...