Почему потоковая передача данных с использованием flume не выполняется как текст - PullRequest
0 голосов
/ 30 сентября 2019

при потоковой передаче данных по потоку с использованием источника netcat в каталоге хранилища и того же файла, который я использую в таблице кустов. В table.it отсутствует правильный текст, показывающий, что часть содержимого находится в формате файла последовательности.

Ниже приведен мой конфиг flume

agent1.sources=source1
agent1.channel=channel1
agent1.sinks=sink1
agent1.sources.source1.type=netcat
agent1.sources.source1.bind=127.0.0.1
agent1.sources.source1.port=44444
agent1.sources.source1.interceptors=i1
agent1.sources.source1.interceptors.i1.type=regex_filter
agent1.sources.source1.interceptors.i1.regex=female
agent1.sources.source1.interceptors.i1.excludeEvents=true
agent1.channels.channel1.type=memory
agent1.channels.channel1.capacity=1000
agent1.channels.channel1.transactionCapacity=100

agent1.sinks.sink1.type=hdfs
agent1.sinks.sink1.hdfs.path=hdfs://localhost:9000/user/hive/warehouse/demo
agent1.sinks.sink1.fileType=DataStream
agent1.sinks.sink1.hdfs.writeFormat=Text

agent1.sinks.sink1.channel=channel1
agent1.sources.source1.channels.channel1

Я попробовал ниже также по-прежнему выпускать настоящий agent1.sinks.sink1.hdfs.fileSuffix = .txt

Я ожидаю результат: alok,100000, мужчины, 29 джатинов, 105000, мужчины, 32 йогеша, 134000, мужчины, 39 лет, но фактический результат. jatin105000SEQorg.apache.hadoop.io.Textorg.apache.hadoop.io.TextU▒Wn▒▒G▒ ~ 3JS▒yogesh134000x

...