С чего начать с распределенных вычислений? - PullRequest
13 голосов
/ 12 мая 2010

Мне интересны методы обучения распределенным вычислениям. Как разработчик Java, я, вероятно, хочу начать с Hadoop . Не могли бы вы порекомендовать несколько книг / учебников / статей для начала?

Ответы [ 7 ]

9 голосов
/ 12 мая 2010

Возможно, вы сможете сначала прочитать некоторые статьи, связанные с MapReduce и распределенными вычислениями, чтобы лучше понять его. Вот некоторые, которые я хотел бы рекомендовать:

С другой стороны, если вы хотите лучше узнать Hadoop, возможно, вы можете начать читать исходный код фреймворка Hadoop MapReduce.

3 голосов
/ 13 мая 2010

В настоящее время, в порядке, я бы проверил - Hadoop A Definition Guide . Его написал Том Уайт, который давно работает над Hadoop и работает в Cloudera с Дугом Каттингом (создателем Hadoop).

Кроме того, Джимми Лин из UMD написал книгу под названием: Интенсивная обработка текста с помощью MapReduce . Вот ссылка на окончательный вариант подготовки к выпуску (ссылка предоставлена ​​автором на его сайте ).

2 голосов
/ 06 апреля 2013

Hadoop не обязательно лучший инструмент для решения всех задач распределенных вычислений. Несмотря на свою мощь, он также имеет довольно крутую кривую обучения и стоимость владения. Вы можете уточнить ваши требования и искать подходящие альтернативы в мире Java, такие как HTCondor , JPPF или GridGain (мои извинения тем, кого я не говоря).

1 голос
/ 25 сентября 2014

Если вы хотите изучить распределенную вычислительную платформу, которая менее сложна, чем Hadoop, вы можете попробовать Zillabyte.Вам нужно знать только некоторые Ruby или Python для создания приложений на платформе.

Как сказал LoLo, Hadoop - это мощное решение, но с него может быть сложно начать.

Для материалов, чтобы узнать о распределенных вычислениях, попробуйте http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-824-distributed-computer-systems-engineering-spring-2006/syllabus/. Также есть несколько ресурсов, рекомендуемых курсом

1 голос
/ 04 апреля 2013

MIT 6,824 - лучший материал. Недостаточно только читать статьи Google, связанные с Hadoop. Системное изучение курса требуется, если вы хотите углубиться.

1 голос
/ 21 мая 2010

Подкаст All Things Hadoop http://allthingshadoop.com/podcast имеет хороший контент и хороших гостей.Во многом это связано с началом работы с распределенными вычислениями.

1 голос
/ 12 мая 2010

Вот некоторые ресурсы от Yahoo! Сеть разработчиков

учебник:

http://developer.yahoo.com/hadoop/tutorial/

вводный курс (требуется Siverlight, вздох):

http://yahoo.hosted.panopto.com/CourseCast/Viewer/Default.aspx?id=281cbf37-eed1-4715-b158-0474520014e6

...