Совершенно верно, с появлением интерфейса HDFS со стрелкой, который теперь предпочтительнее, чем hdfs3, рассмотрение расположения блоков больше не является частью рабочих нагрузок, обращающихся к HDFS, поскольку реализация стрелки не включает метод get_block_locations ().
Однако мы уже хотели удалить несколько запутанный код, который сделал эту работу, потому что мы обнаружили, что пропускная способность между узлами в тестовых развертываниях HDFS была совершенно достаточной, что практически не имело практического значения в большинстве рабочих нагрузок.Дополнительные ограничения на размер блоков по сравнению с размером разделов, которые вы хотели бы видеть в памяти, создали дополнительный уровень сложности.
Удаляя специализированный код, мы могли бы избежать особого случая, который был сделан для HDFS, в отличие от внешнего облачного хранилища (s3, gcs, azure), где не имело значения, какой работник обращался к какой частиданные.
Короче говоря, да, документы должны быть обновлены.