Я пытаюсь разбить большой CSV-файл на несколько частей в виде файлов с Python. в качестве первой попытки я прочитал первые 261579 строки из файла набора данных CSV, используя эту часть кода:
for c in range(261579):
line = datasetFile.readline()
if len(line) == 0:print("empty line detected at : " ,c)
lines.append(line)
print("SAVING LINES ......")
split = open(outputDirectoryName+"spilt" + str(x+1) +".csv","w")
split.writelines(lines)
print("SPLIT " + str(x+1) + " END with " ,str(len(lines)) , "lines .")
ОК, на данный момент код работает хорошо и показывает me
"SPLIT 1 END с 261579 строками."
, но проблема в том, что когда я открываю свой файл "Split1.csv" с помощью notpad ++, я нахожу только 261575 вместо 261579 , это потеря данных для 4 строк где-то в файле.
С этой пропорцией я хочу знать, что именно происходит с " file.writeLines (lines) "метод, когда мы используем его для сохранения моих данных в разделенном файле?