Я работаю над Flume, чтобы добавить данные из локального каталога в HDFS с использованием Flume Source TAILDIR .
Мой пример использования - Delta Load, если новая строка приходит в источникфайл в локальной директории, так что добавится в hdfs.
Это мой файл конфигурации Flume :
#configure the agent
agent.sources=r1
agent.channels=k1
agent.sinks=c1
agent.sources.r1.type=TAILDIR
agent.sources.r1.positionFile = /home/flume/Documents/taildir_position.json
agent.sources.r1.filegroups=f1
agent.sources.r1.filegroups.f1=/home/flume/Documents/spooldir/
agent.sources.r1.batchSize = 20
agent.sources.r1.writePosInterval=2000
agent.sources.r1.maxBackoffSleep=5000
agent.sources.r1.fileHeader = true
agent.sources.r1.channels=k1
agent.channels.k1.type=memory
agent.channels.k1.capacity=10000
agent.channels.k1.transactionCapacity=1000
agent.sinks.c1.type=hdfs
agent.sinks.c1.channel=k1
agent.sinks.c1.hdfs.path=hdfs://localhost:8020/flume_sink
agent.sinks.c1.hdfs.batchSize = 1000
agent.sinks.c1.hdfs.rollSize = 268435456
agent.sinks.c1.hdfs.writeFormat=Text
при выполнении команды flume: flume-ng agent -n agent -c conf -f / home/swechchha/Documents/flumereal.conf
Я получаю ошибку
Я получаю ошибку при загрузке файла JSON.