Фрейм данных имеет 906133 строки, например:
df.shape
(906133, 24)
И я попытался сохранить его как файл csv:
df.to_csv ('df.csv', encoding = 'utf-8-sig ', index = False)
Затем прочитайте его снова;
test_lines = pd.read_csv (' df.csv ')
Однако теперь в нем гораздо больше строк:
test_lines.shape
(16512050, 24)
После некоторого наблюдения дополнительные строки в основном содержат ряд точек (...........) или запятых(,,,,,,,,,,,,,,,).Если я добавлю sep = '\ t' для команды сохранения и чтения, число дополнительных строк уменьшится, но все еще будет существовать.