Я пишу код луча Apache, в котором мне нужно прочитать файл JSON, который был помещен в папку проекта, и прочитать данные и передать их в поток.
Это пример кода для чтения JSON.Это правильный способ сделать это?
PipelineOptions options = PipelineOptionsFactory.create();
options.setRunner(SparkRunner.class);
Pipeline p = Pipeline.create(options);
PCollection<String> lines = p.apply("ReadMyFile", TextIO.read().from("/Users/xyz/eclipse-workspace/beam-prototype/test.json"));
System.out.println("lines: " + lines);
или я должен использовать,
p.apply(FileIO.match().filepattern("/Users/xyz/eclipse-workspace/beam-prototype/test.json"))
Мне просто нужно прочитать ниже файл json.Прочитайте полный файл testdata
из этого файла, а затем выполните его потоковую передачу.
{
“testdata":{
“siteOwner”:”xxx”,
“siteInfo”:{
“siteID”:”id_member",
"siteplatform”:”web”,
"siteType”:”soap”,
"siteURL”:”www”,
}
}
}
Приведенный выше код не читает файл json, он печатает как
lines: ReadMyFile/Read.out [PCollection]
, не могли бы выназовите мне образец?