У меня есть File1 с "id, name" и File2 с "id, address". Я не могу загрузить первый файл (менее 2 ГБ): он вылетает после 76 тыс. Строк (с конкатом чанка) и только 2 столбцов ... Я не могу также прочитать read_csv для второго файла, потому что он вылетает из ядра после загрузки некоторых строк.
Мне нужно объединить File1 и File2 с "id", но если я не могу поместить файлы в переменную dataframe, я не знаю, как это сделать ...
Файл размером всего 5 ГБ с 30M строками, но после нескольких секунд загрузки происходит сбой ядра.
Как присоединить файл без фрейма, пожалуйста?
Я пробовал с броском, но он падает.
chunks = []
cols = [...]
for chunk in pd.read_csv("file2.csv", chunksize=500000, sep=',', error_bad_lines=False, low_memory=False, usecols=cols):
chunks.append(chunk)
df = pd.concat(chunks, axis=0)
print(f.shape)
Мне нужен файл данных для загрузки, чтобы присоединиться к ним или присоединиться к файлу без загрузки, если это возможно