Мне нужно иметь возможность эффективно извлекать данные R по сети.Типичный набор данных, который я пытаюсь получить, состоит из нескольких сотен тысяч чисел.
В настоящее время я использую saveRDS для хранения данных и readRDS для их извлечения, что дает мне приличную производительность.Но некоторые из предварительно вычисленных результатов могут по-прежнему находиться в диапазоне десятков МБ из-за того, что R хранит каждое число в 4 байтах.Для моего приложения мне не нужно больше точности, чем 1 или, самое большее, 2-байтовое целое число, поэтому я думаю, что смогу сэкономить некоторое время, сохраняя двоичные данные в другом формате.
Iне удалось найти в Интернете ничего об эффективном хранении данных R в форматах с пониженной точностью.Очевидно, я мог читать и записывать в / из моего собственного двоичного формата, но я предполагаю, что издержки цикла, выполняемые в R, намного перевесят любые преимущества в производительности, которые я получу, сократив время чтения / передачи по сети.
Кто-нибудь имеет опыт работы с этим?