Использование Flume для экспорта данных в HDFS - PullRequest
0 голосов
/ 19 февраля 2020

Я пытался использовать конфигурацию Flume для экспорта файла CSV в HDFS. Я прошел через конфигурацию несколько раз.

agt1.sources = source_spool
agt1.channels = mem_channel notmem_channel
agt1.sinks = hdfs_mem hdfs_nmem


#Describing source:

agt1.sources.source_spool.type = spooldir
agt1.sources.source_spool.channels = mem_channel notmem_channel
agt1.sources.source_spool.spoolDir = /home/cloudera/spooldirsource
agt1.sources.source_spool.fileHeader = false
agt1.sources.source_spool.bind = localhost
agt1.sources.source_spool.port = 41415



#Describe the Channel
agt1.channels.mem_channel.type = file
agt1.channels.mem_channel.capacity = 100000
agt1.channels.mem_channel.transactionCapacity = 1000

agt1.channels.notmem_channel.type = file
agt1.channels.notmem_channel.capacity = 100000
agt1.channels.notmem_channel.transactionCapacity = 1000


#Interceptors for is_member
agt1.sources.source_spool.interceptors = i1
agt1.sources.source_spool.interceptors.i1.type = regex_extractor
agt1.sources.source_spool.interceptors.i1.regex = ^(\\d)
agt1.sources.source_spool.interceptors.i1.serializers = s1
agt1.sources.source_spool.interceptirs.i1.serializers.s1.name = is_member



#Selector 
agt1.sources.source_spool.selectors.type= multiplexing
agt1.sources.source_spool.selectors.header = is_member
agt1.sources.source_spool.selectors.mapping.1 = mem_channel
agt1.sources.source_spool.selectors.mapping.0 = notmem_channel

#Sink description

agt1.sinks.hdfs_mem.type = hdfs
agt1.sinks.hdfs_mem.hdfs.path = /tmp/flume-spooldir/is_member=1
agt1.sinks.hdfs_mem.hdfs.fileType = DataStream
agt1.sinks.hdfs_mem.channel = mem_channel

agt1.sinks.hdfs_nmem.type = hdfs
agt1.sinks.hdfs_nmem.hdfs.path = /tmp/flume-spooldir/is_member=0
agt1.sinks.hdfs_nmem.hdfs.fileType = DataStream
agt1.sinks.hdfs_nmem.channel = notmem_channel

Когда я запускаю агент, я сталкиваюсь с ошибкой:

ERROR node.AbstractConfigurationProvider: Source source_spool has been removed due to an error during configuration

Я что-то не так делаю в названии источника / указании исходного каталога? Я уже создал исходный каталог.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...