У меня есть API, который подключен к AWS лямбда, который делает следующее:
- Получение JSON данных из s3. Количество записей около 60 000
- Использование библиотеки Json2csv для анализа данных JSON в строку csv
- Помещение результата строки csv в корзину s3
Точка 2 выше занимает слишком много времени для разбора данных JSON в строку csv. Библиотека, которую я использую для этого: json2csv: https://www.npmjs.com/package/json2csv
Ниже приведен мой код:
/// Get data in JSON format in object: records (array of JSON)
let headers = [
{
label: "Id",
value: "id"
},
{
label: "Person Type",
value: "type"
},
{
label: "Person Name",
value: "name"
}
];
let json2csvParser = new Parser({ fields: headers });
console.log("Parsing started");
let dataInCsv = json2csvParser.parse(records);
console.log("Parsing completed");
// PutObject of dataInCsv in s3
Для анализа 60К-записей требуется около 20 секунд. Что я могу сделать, чтобы улучшить производительность здесь? Любая другая библиотека? Я привык думать, что операции с памятью выполняются довольно быстро. Почему этот разбор медленный? Любая помощь, пожалуйста.