Ищете общий обзор на Hadoop - PullRequest
5 голосов
/ 10 июня 2011

Мне нужен обзор производительности по Hadoop (кластер на 300-600 блоков, стандартное оборудование), особенно по следующим аспектам:

  1. Высокая скорость одновременного чтения и записи
  2. Webcrawling
  3. Mapreduce, параллельные вычисления
  4. Инвертированный индекс

1 Ответ

2 голосов
/ 22 июня 2011

Это не конкретный вопрос, может быть, поэтому никто не ответил до сих пор. Производительность на кластере 3-600 узлов лучше всего анализировать с помощью тестов производительности.

Тем не менее, я нашел несколько действительно интересных статей, касающихся Hadoop и его реализаций:

Я надеюсь, что эти ссылки помогут вам начать работу и предоставят всю необходимую вам информацию.

...