Если вы планируете всегда искать фотографии по photo_id, вы должны рассматривать его как хранилище значений ключа с photo_id в качестве ключа и изображение в качестве значения столбца. Метаданные (имя файла, имя автора) могут храниться в дополнительных столбцах в той же строке, если они обычно нужны одновременно с изображением.
Если ваши изображения очень большие, рассмотрите возможность их разбиения на части по 1–10 МБ, по одному столбцу на фрагмент, чтобы вам не приходилось извлекать их все сразу.
Если вам также необходимо время от времени искать по имени автора, используйте второй CF в качестве индекса, где ключ строки - это имя автора, а столбцы - идентификаторы photo_id. Затем вы можете получить фактические изображения из первого CF по photo_id.
Непонятно, что вы подразумеваете под "быстрой итерацией", но если вы планируете сканировать весь набор данных изображения на 1 м, вы можете сделать это довольно легко с первым описанным CF с помощью get_range_slices .