Напишите InputFormat, который читает файлы PCAP, возвращая что-то вроде LongWritable для ключа (n-й пакет в файле) и PacketWritable в качестве значения (содержащего данные PCAP). Для InputSplit вы можете использовать FileSplit или MultiFileSplit для лучшей производительности, так как отдельный файл PCAP может быть прочитан на удивление быстро.
Если размер вашего блока не превышает размер ваших файлов pcap, вы будете испытывать множество сетевых операций ввода-вывода ...