У меня есть большой CSV-файл со следующей структурой:
col1,col2,codes
1,2,aaa__bbb
2,4,aaa__eee
3,4,ccc
Столбец 3 кодируется в виде трех кодов символов, разделенных «__».
Я хотел бы создать новый CSV, который реплицирует строки для каждого компонента кодов столбцов. Результаты должны быть такими:
col1,col2,codes
1,2,aaa
1,2,bbb
2,4,aaa
2,4,eee
3,4,ccc
Это довольно большой файл (около 10G). Я хотел бы выполнить этот bash (awk?) Без использования языка программирования, если это возможно. Фактический файл имеет около 3000 столбцов.