Question

Хотите сохранить ошибочные записи в конвейере потока данных Google, чтобы его можно было найти / повторить позже. Что является лучшим компонентом для хранения неудачных записей? Записи должны храниться с точки зрения клиента и даты (для каждого дня). Подходит ли для этого сценария Pub / Sub, Bigquery или Datastore?

chamikara · Answer 1 · 03 апреля 2019

Я не верю, что в Beam есть обобщенное решение для этого. Каждый приемник может предлагать свой собственный способ сбора и обработки неудачных записей. Например, приемник BigQuery предлагает функцию getFailedInserts (), которая позволит вам получить PCollection неудачных записей при записи в BigQuery с использованием потоковых вставок. Если вы пишете из пользовательского преобразования ParDo, вы можете реализовать аналогичную функцию, выводя сбойные элементы из вашего ParDo.

Каков рекомендуемый подход для хранения неудачных записей в конвейере потока данных Google?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Каков рекомендуемый подход для хранения неудачных записей в конвейере потока данных Google?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы