Предполагая, что вы можете прочитать каждый файл отдельно в памяти, вы можете использовать collections.Counter
для создания списка счетчиков.
Затем объедините их на последнем этапе с помощью sum
.
from io import StringIO
import pandas as pd
from collections import Counter
file1 = StringIO("""gender
man
woman
woman
woman""")
file2 = StringIO("""gender
man
man
woman
woman""")
# replace file1, file2 with 'file1.csv', 'file2.csv'
lst = [Counter(pd.read_csv(f)['gender']) for f in [file1, file2]]
# aggregate list of Counter objects
res = sum(lst, Counter())
print(res)
Counter({'man': 3, 'woman': 5})
Если вы не можете загрузить хотя бы один файл в память, вы можете использовать csv.reader
с collections.defaultdict
, чтобы выполнять итерацию построчно и получать эквивалентный результат.