Отслеживание статуса задания Hadoop через веб-интерфейс? (Разоблачение Hadoop для внутренних клиентов в компании) - PullRequest
3 голосов
/ 11 апреля 2010

Я хочу разработать веб-сайт, который позволит аналитикам внутри компании запускать задания Hadoop (выбрать из набора заданных заданий) и видеть статус их работы \ прогресс.

Существует ли простой способ сделать это?это (получить статусы рабочих мест и т. д.) через Ruby \ Python?Как вы предоставляете свой кластер Hadoop внутренним клиентам вашей компании?

Ответы [ 4 ]

5 голосов
/ 11 ноября 2010

Я нашел один способ получить информацию о вакансиях на JobTracker. Это код:

    Configuration conf = new Configuration();
    conf.set("mapred.job.tracker", "URL");

    JobClient client = new JobClient(new JobConf(conf));

    JobStatus[] jobStatuses = client.getAllJobs();
    for (JobStatus jobStatus : jobStatuses) {

        long lastTaskEndTime = 0L;

        TaskReport[] mapReports = client.getMapTaskReports(jobStatus.getJobID());
        for (TaskReport r : mapReports) {
            if (lastTaskEndTime < r.getFinishTime()) {
                lastTaskEndTime = r.getFinishTime();
            }
        }

        TaskReport[] reduceReports = client.getReduceTaskReports(jobStatus.getJobID());
        for (TaskReport r : reduceReports) {
            if (lastTaskEndTime < r.getFinishTime()) {
                lastTaskEndTime = r.getFinishTime();
            }
        }
        client.getSetupTaskReports(jobStatus.getJobID());
        client.getCleanupTaskReports(jobStatus.getJobID());

        System.out.println("JobID: " + jobStatus.getJobID().toString() + 
                            ", username: " + jobStatus.getUsername() + 
                            ", startTime: " + jobStatus.getStartTime() + 
                            ", endTime: " + lastTaskEndTime + 
                            ", Durration: " + (lastTaskEndTime - jobStatus.getStartTime()));

    }
2 голосов
/ 29 июля 2010

Начиная с версии 'beta 2' дистрибутива Hadoop от Cloudera, вы почти без труда можете использовать Hadoop User Experience (HUE), который ранее назывался Cloudera Desktop.

Но с тех пор эта версия сильно выросла. Он поставляется с дизайнером работы, интерфейсом улья и многим другим. Вы должны определенно проверить это, прежде чем принять решение о создании собственного приложения.

1 голос
/ 12 апреля 2010

Может быть, для начала стоит взглянуть на Cloudera Destktop . Он предоставляет веб-интерфейс для выполнения задач администрирования кластера и разработки заданий. Его можно загрузить бесплатно.

0 голосов
/ 12 апреля 2010

Нет ничего подобного, что поставляется с hadoop. Это должно быть тривиально, чтобы построить эту функциональность. Некоторые из них доступны на странице JobTracker, а некоторые вам придется создавать самостоятельно.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...