Кажется, что нет никакого способа добавить данные в существующий сериализованный файл Avro. Я хотел бы, чтобы несколько процессов записывали в один файл avro, но, похоже, каждый раз, когда я его открываю, я начинаю все заново. Я не хочу читать все данные, а затем снова записывать их обратно.
Используя пример кода ruby, я пробовал "ab" и "ab +" в качестве различных настроек, но без радости.
file = File.open('data.avr', 'wb')
schema = Avro::Schema.parse(SCHEMA)
writer = Avro::IO::DatumWriter.new(schema)
dw = Avro::DataFile::Writer.new(file, writer, schema)
dw << {"username" => "john", "age" => 25, "verified" => true}
dw << {"username" => "ryan", "age" => 23, "verified" => false}
dw.close