Какие хорошие ресурсы для изучения исходного кода Hadoop? - PullRequest
15 голосов
/ 17 июня 2011

Есть ли хорошие ресурсы, которые могли бы помочь мне изучить исходный код Hadoop? Я особенно ищу университетские курсы или исследовательские работы.

Ответы [ 2 ]

26 голосов
/ 26 июля 2011

Изучение Hadoop или MapReduce может оказаться сложной задачей, если вы запачкали руку на старте.
Я следовал расписанию следующим образом:

  1. Начните с самых основ MR с кодом.google.com/edu/parallel/dsd-tutorial.html code.google.com/edu/parallel/mapreduce-tutorial.html
  2. Затем перейдите к первым двум лекциям в www.cs.washington.edu/образование / курсы / cse490h / 08au / lectures.htm Очень хорошее введение в MapReduce и Hadoop.
  3. Прочитайте основную статью http://research.google.com/archive/mapreduce.html и ее улучшения в обновленной версии http://www.cs.washington.edu/education/courses/cse490h/08au/readings/communications200801-dl.pdf
  4. Затем перейдите ко всем другим видео по ссылке U.Washington, приведенной выше.
  5. Попробуйте использовать термины «Карта сокращения» и «Hasoop», чтобы найти видео от ORielly и Google RoundTable для хорошего обзора будущего Hadoop иMapReduce
  6. Затем перейдем к наиболее важным видео -
    Cloudera Videos
    www.cloudera.com/resources/?media=Video
    и
    Google MiniLecture Series
    код.google.com/edu/submissions / mapreduce-minilecture / list.html

Наряду со всеми вышеупомянутыми мультимедиа нам нужен хороший письменный материал
Документы:

  1. Схемы архитектуры на сайте hadooper.blogspot.com - это хорошо иметь на своей стене
  2. Hadoop: исчерпывающее руководство в большей степени описывает основные аспекты всей системы, в то время как Hadoop в действии хорошо читается с множеством обучающих примеров для изучения концепций hadoop,Pro Hadoop не для начинающих
  3. pdfs документации Apache Foundation
    hadoop.apache.org/common/docs/current/
    и hadoop.apache.org/common/docs/stable/
    поможет вам узнать, как смоделировать вашу проблему в решении МР, чтобы в целом получить преимущества Hadoop.
  4. Бумага HDFS от Yahoo!Исследования также хорошо читаются, чтобы получить глубокие знания о hadoop
  5. Подпишитесь на Список рассылки пользователей, MapReduce и HDFS, чтобы узнать о проблемах, решениях и будущих решениях.
  6. Попробуйте ссылку http://developer.yahoo.com/hadoop/tutorial/module1.html для начинающих на экспертный путь к Hadoop

Для любых запросов ...
Свяжитесь с Apache, Google, Bing, Yahoo!

3 голосов
/ 17 июня 2011

Ваш вопрос кажется чрезмерно широким - чтобы получить ресурс для использования при просмотре исходного кода, вам следует сузить фокус на том, что вы хотите изучить.Это облегчит вам (и всем, кто занимается SO) поиск статей / тем на эту тему.

Я несколько раз копался в источнике Hadoop.Обычно с очень специфическим классом, о котором мне нужно было узнать.В этих случаях внешний ресурс на самом деле не был нужен, и, поскольку у меня было имя класса, я просто нашел его и нашел.

Если бы я начал пытаться понять источник hadoop на более высоком уровне, я бы получил исходный код и свою копию Hadoop: полное руководство и использовал бы его в качестве ссылки напонять соединения более высокого уровня исходного кода.

Я не буду утверждать, что это было бы идеальным решением.H: TDG находится на более техническом уровне, чем другие мои книги по Hadoop, и я нахожу это очень информативным.H: TDG - это то, с чего я начну, и когда я найду области, в которые я хотел бы углубиться, я специально начну их искать.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...