У меня есть большой CSV-файл (приблизительно 1 ГБ), который я хочу преобразовать в JSON-файл следующим образом:
CSV-файл имеет следующую структуру:
заголовок:tid;inkey;outkey;value
значения:
tid1;inkey1;outkey1;value1
tid1;inkey2;outkey2;value2
tid2;inkey2;outkey3;value2
tid2;inkey4;outkey3;value2
и т. Д.
Идея состоит в том, чтобы преобразовать этот CSV в JSON со следующей структурой, в основном, чтобы сгруппировать все по "TID":
{
"tid1": {
"inkeys":["inkey1", "inkey2"],
"outkeys":["outkey1", "outkey2"]
}
}
Я могу себе представить, как это сделать обычными диктонами и списками Python, но моя проблема также в огромном количестве данных, которые я должен обработать.Я полагаю, что панды могут помочь здесь, но я все еще очень запутался с этим инструментом.