Question

Я пытаюсь реализовать генератор суррогатных ключей, используя PIG. Мне нужно сохранить последний сгенерированный ключ в базе данных и запросить в базе данных следующий доступный ключ.

Есть ли какая-либо поддержка в PIG для запроса базы данных с использованием ODBC? Если да, пожалуйста, предоставьте руководство или несколько образцов.

Donald Miner · Answer 1 · 14 февраля 2012

Извините, что не ответили на ваш вопрос напрямую, но вы не хотите этим заниматься.По нескольким причинам:

Ваша работа в MapReduce собирается превратить вашу базу данных в единую точку контроля производительности (вы, по сути, побеждаете цель Hadoop).
С умозрительнымвыполнение , у вас будут загружаться одни и те же данные дважды, поэтому некоторые уникальные идентификаторы не будут существовать, когда одна из задач будет убита.

Я думаю, что вы сможете поразить базу данныходин раз для каждой записи вы можете просто выполнить это суррогатное обогащение ключей без MapReduce в одном потоке.

В любом случае, создание суррогатных ключей или автоматических счетчиков в Hadoop нелегко из-за того, что эта вещь не используется для совместного использования.

PIG латинский скрипт для доступа к базе данных

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

PIG латинский скрипт для доступа к базе данных

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы