В Kafka брокер добавляет к диску в точности то, что отправил производитель.
Однако, как вы намекнули, производитель упаковывает сообщение в запись и пакет.
Полное описание этих структур данных можно найти в документации .
Кроме очень маленьких сообщений, дисковое пространство, занимаемое сообщением, зависит в основном от его размера, так как накладные расходы Kafka на сообщение составляютсравнительно небольшой.
Например, для одного сообщения длиной 10 байт без ключа или заголовков размер на диске составит 78 байт.Это может показаться большим объемом служебной информации, но, поскольку он почти постоянен независимо от размера сообщения, если бы полезная нагрузка составляла 1024 байта, общий объем занятого диска составил бы только 1094 байта.
Если принять во внимание пакетирование, тоиздержки уменьшаются еще больше, поскольку заголовок пакета (~ 50 байт) будет использоваться для нескольких записей.