Итак, у меня есть два CSV-файла, которые я пытаюсь сравнить и получить результаты этого элемента в одном столбце. Первый файл, a.csv, как показано ниже:
name pubmedid country
legge 3064733 U.S
legge 3034763 U.S
Hoffman 2888122 NA
, а второй CSV - это b.csv, который выглядит следующим образом:
name pubmedid country category
Sung 3454733 U.K European
NA 2035763 U.S American
Hoffman 3194992 NA Asian
legge 3064733 U.S African-American
Я хочу извлечь информацию из столбцов которые являются общими для двух файлов
, чем объединить их в один файл CSV и удалить все строки, содержащие «NA»
, поэтому результат, который я хочу получить, будет выглядеть следующим образом:
name pubmedid country
legge 3064733 U.S
legge 3034763 U.S
Sung 3454733 U.K
legge 3064733 U.S
чем я хочу записать этот результат в c .csv файл.
Как я могу это сделать?
Я пытаюсь найти способ сделать это без используя pandas, потому что я до сих пор не до конца понял, как работает pandas, и попытался пропустить строку, содержащую 'NA', при чтении файла csv origian a, b, но мне не удалось ... лучше удалить строку которые содержат NA после слияния двух файлов вместе?