У меня есть 5 CSV-файлов, которые имеют такие данные:
Файл 1:
- rsid chr pos a1 a0 beta se pvalue nsample
- rs1234 1 123 A C 0.985 0.12 1e-5 1276
- rs4567 2 234 T G 0.276 0.34 1e-2 3847
- rs8910 3 345 C T 0.847 0.29 2e-6 3949
Файл 2:
- rsid chr pos a1 a0 beta se pvalue nsample
- rs1234 1 123 A C 0.598 0.93 1e-3 3949
- rs8910 3 345 C T 0.3039 0.29 1e-3 0392
Файл 3:
- rsid chr pos a1 a0 beta se pvalue nsample
- rs1234 1 123 A C 3.094 1.29 1e-2 0303
- rs4567 2 234 T G 2.101 2.09 1e-2 9922
- rs8910 3 345 C T 0.229 1.09 2e-3 9329
Аналогично файлы 4 и 5.
Я хочу, чтобы они были объединены следующим образом: (Заголовки должны быть удалены)
- rs1234 1 123 A C
- 0.985 0.12 1e-5 1276 (from file 1)
- 0.598 0.93 1e-3 3949 (from file 2)
- 3.094 1.29 1e-2 0303 (from file 3)
- rs4567 2 234 T G
- 0.276 0.34 1e-2 3847 (from file 1)
- 0 0 0 0 0 (from file 2)
- 2.101 2.09 1e-2 9922 (from file 3)
- rs8910 3 345 C T
- 0.847 0.29 2e-6 3949 (from file 1)
- 0.3039 0.29 1e-3 0392 (from file 2)
- 0.229 1.09 2e-3 9329 (from file 3)
Для каждого rsid первые пять столбцов одинаковы в каждом файле (т.е. rsid, chr, pos, a1, a0). Они становятся первой линией. Остальные столбцы имеют разные детали. Они располагаются один под другим в том же порядке, что и файл1, файл2 и файл3. Если определенный rsid не найден ни в одном файле, то должны быть нули (0,0,0,0,0).
Слово в скобках (из файла1, из файла2 и из файла3) предназначено для понимания. Их не нужно включать в объединенный файл.