У меня проблемы с памятью в моей R-скрипте, обрабатывающей огромную папку.Мне нужно выполнить несколько операций для каждого файла, а затем вывести одну строку для каждого файла в мой фрейм данных результатов.
иногда результирующий фрейм данных имеет сотни строк, вставленных вместе в одну строку, как если бы он застрял в одной строке(кажется, что rbind не работает нормально, когда нагрузка огромна) Я думаю, что проблемы возникают при сохранении временного фрейма данных в памяти для добавления результатов, поэтому я использую другой подход: цикл для чтения каждого файла один за другим, процессзатем откройте файл подключения к результатам, напишите строку, закройте подключение и перейдите к следующему файлу.Мне пришло в голову, что избежание большого df в памяти и немедленная запись в файл могут решить мои проблемы.
Я предполагаю, что это очень неэффективно, поэтому мой вопрос: есть ли другой способ эффективного добавления построчно вместо вывода?привязки фрейма данных в памяти и записи на диск в конце?
Я разбираюсь во многих вариантах: раковина, кошка, строка записи ...... я сомневаюсь, какой из них использовать дляизбегайте конфликтов и будьте максимально эффективны при данных условиях