Нам нужно удалить строки из обоих файлов, если значение первого столбца отсутствует в другом файле.
Давайте рассмотрим два файла CSV :
file1.csv:
yrdi_391 111 1.11 1.0 1.1 111.0
yfyrn_9132 222 2.22 2.0 2.2 222.0
kdkfke_392 999 9.99 9.0 9.9 999.0
hfeisk_3 333 3.33 3.0 3.3 333.0
file2.csv:
yrdi_391 444 4.44 4.0 4.4 444.0
yfyrn_9132 555 5.55 5.0 5.5 555.0
hfeisk_3 666 6.66 6.0 6.6 666.0
fhedn_271 888 8.88 8.0 8.8 888.0
Теперь нам нужно удалить всю строку, начиная с kdkfke_392
из file1.csv
, поскольку ее там нет file2.csv
.
С другой стороны, нам нужно удалить всю строкуначиная с fhedn_271
, поскольку его нет в file1.csv
.
Ожидаемый результат :
file1.csv:
yrdi_391 111 1.11 1.0 1.1 111.0
yfyrn_9132 222 2.22 2.0 2.2 222.0
hfeisk_3 333 3.33 3.0 3.3 333.0
file2.csv:
yrdi_391 444 4.44 4.0 4.4 444.0
yfyrn_9132 555 5.55 5.0 5.5 555.0
hfeisk_3 666 6.66 6.0 6.6 666.0
На данный момент строки в file1.csv
иfile2.csv
не отсортированы.При необходимости мы можем сначала выполнить сортировку, а затем применить удаление.
Панды, связанные с CVS, предпочтительнее, поскольку в обоих файлах у нас есть заголовки, и мы должны их сохранить.
Новичок вскрипты на питоне!
Любая помощь будет высоко оценена!