Я пытаюсь проанализировать некоторые данные, и для этого я создаю новый файл CSV, записав несколько строк, которые составлены из других файлов CSV. Я извлек данные из одного из файлов (oldfile1
), поэтому это список (с конкретными индексами, которые я использую для добавления в новый файл), но другой (oldfile2
), который я использую для базы файла, так что я могу напрямую добавить строки из этого файла, так как они не нуждаются в фильтрации. Формула для новой строки должна быть row from oldfile2 + row from oldfile1
. first
намерен пропустить строку комментария. Тем не менее, этот код в настоящее время создает очень большой выходной файл (200 МБ) - я подозреваю, что он циклически повторяется несколько раз в строке, дублируя записанные строки. Тем не менее, я не могу сразу думать о другом способе обеспечения того, чтобы строки из oldfile2 проходили циклически, не дублируя записанные строки. Я также не могу дать более подробную информацию о выходном файле, так как он вылетает всякий раз, когда я пытаюсь открыть его. Любая помощь приветствуется.
with open('newfile.csv','w+') as f:
reader = csv.reader(open('oldfile2.csv'), delimiter=',')
writer = csv.writer(f, delimiter=',')
first = next(reader)
for oldrow2 in reader:
outline = [oldrow2 + oldfile1[i] for i in oldfile1_indices]
writer.writerow(outline)```