Некоторые вопросы с Flume - PullRequest
       20

Некоторые вопросы с Flume

0 голосов
/ 23 декабря 2018

Я хотел использовать Flume для отправки большого количества файлов в hadoop, и у меня была идея использовать спул, но у меня есть несколько вопросов, подобных этому:

  1. При отправкефайлы в hadoop, файлы в спуле никуда не перемещаются, что заставляет меня задаться вопросом, есть ли новый файл в спуле, как Flume распознает старые и новые файлы?

  2. Как Flume после загрузки файла в hadoop будет перемещать файлы в буфере в другую папку?Или у Flume есть механизм для резервного копирования файлов?

  3. Я знаю, что у Flume есть некоторые свойства, которые помогают работать с регулярными выражениями, но я не знаю, поддерживает ли Flume отправку файлов в hadoop и сортировку этих файлов.в каталогах на основе регулярных выражений?Если да, то как мне это сделать?
  4. Поддерживает ли Flume отправку файлов в hadoop и их классификацию по каталогам на основе даты отправки?(Я прочитал эту часть в HDFS Sink, но когда я попробовал, это не удалось)
  5. При использовании Flume для отправки файлов в hadoop, могу ли я исправить содержимое файла, например, добавив имена файлов в поток данных или изменив";"into "|"?
  6. Могу ли я использовать какой-либо API или какой-либо инструмент для мониторинга передачи файлов Flume в hadoop?Например, во время передачи файлов посмотрите, сколько файлов было передано в hadoop или сколько файлов было успешно отправлено и сколько файлов отправлено в hadoop.
  7. Записывает ли Flume журналы транзакций с помощью hadoop?Например, сколько файлов было загружено в hadoop, ...

Я знаю, что слишком много просил, но я действительно запутался с Flume и мне очень нужна ваша помощь.С нетерпением ждем вашей помощи.Спасибо

...