У меня есть куча имен файлов, которые мне нужно сложить вместе и вставить в новый файл.Первый столбец - даты.Если даты перекрываются от одного файла к другому, я хочу, чтобы следующий файл, который я добавлял, заменил то, что у меня уже есть.Например, если первый файл имеет вид:
1/5/2010 'hello'
1/6/2010 'goodbye'
1/7/2010 'yes'
, а второй файл:
1/7/2010 'No'
1/8/2010 "spam'
1/9/2010 'today'
Я хочу, чтобы мой новый файл выглядел следующим образом:
1/5/2010 'hello'
1/6/2010 'goodbye'
1/7/2010 'No'
1/8/2010 'spam'
1/9/2010 'today'
Сейчас я пытаюсь что-то вроде этого, но не получаю правильных результатов.(читатель 2 и читатель ссылаются на второй файл и первый файл соответственно, newfile2.csv уже содержит содержимое файла 1)
for row in reader2:
for row2 in reader:
if row == row2:
target = open('newfile2.csv', 'wb')
writer = csv.writer(target)
writer.writerow(row)
target.close()
else:
target = open('newfile2.csv', 'ab')
writer = csv.writer(target)
writer.writerow(row)
target.close()
Любые идеи будут высоко оценены.Спасибо, хорошо, поэтому я думаю, что я должен уточнить после прочтения некоторых комментариев.Порядок важен.В конце этого кода, я хочу, чтобы данные за каждый день года были в порядке.Хорошей новостью является то, что данные уже в порядке в файлах, есть только некоторые дубликаты.
Существует более одного дубликата.Например, мой первый файл, с которым я на самом деле имею дело, хранится до 9 марта, а я хочу, чтобы он прекратился в конце февраля.Я хочу получить все данные за март из моего второго файла.
Кроме того, имеется около 1500+ строк, поскольку в реальных файлах каждый час дня также является частью строк.
Надеюсь, это проясняет, что мне нужно сделать.
Я думаю, что может сработать что-то вроде кода, который я выложил выше, но проверить только первый столбец каждой строки (так как только даты будут дублировать друг друга)?Прямо сейчас я проверяю всю строку, и хотя даты являются дубликатами, строки в целом являются уникальными.
О, да, последнее.Я хочу, чтобы все дубликаты были удалены.