Мне нужно прочитать файлы BSON mongo_db dump.
И я думаю о том, как прочитать эти файлы, написав специальный DASK bson_reader.
Проблема заключается в том, чтобы проанализировать файлы BSON mongo_db и перебрать весь файл. При переборе BSON необходимо найти окончания блоков BSON, разделить каждый блок файла и предотвратить загрузку всего файла в память. Модуль pymon go bson может сделать это, но вернуть только файловый итератор, и этот итератор не может использовать, например: dask.bug.load_csv (файл) .map (итератор).
Что такое котел пластинка для написания кастомных dask.bug.bson_read? или есть идеи?